(二) 中度重復序列
中度重復序列是指在真核基因組中重復數十至數萬次(<105)的重復序列。其復性速度快于單拷貝順序,但慢于高度重復序列。少數在基因組中成串排列在一個區域,大多數與單拷貝基因間隔排列。依據重復序列的長度,中度重復序列可分為兩種類型。
1.短分散片段(short interspersed repeated segments,SINES)
重復序列的平均長度為300bp(一般<500bp),與平均長度為1000bp左右的單拷貝序列間隔排列,拷貝數可達10萬左右。如Alu家族、Hinf家族等屬于這種類型的中度重復序列。
Alu家族
是哺乳動物基因組中含量最豐富的一種中度重復順序家族,約占人類基因組的3%~6%。Alu家族每個成員的長度約300bp,每個單位長度中有一個限制性內切酶Alu的切點(AG↓CT),Alu可將其切成兩段,130bp和170bp,因而定名為Alu序列(或Alu家族)。Alu序列分散在基因組中,在間隔區DNA,內含子中都發現有Alu序列。
Alu序列具有種特異性,以人的Alu序列制備的探針只能用于檢測人的基因組中的Alu序列,由于在大多數的含有人的DNA的克隆中都含有Alu序列,因此,可用以人的Alu序列制備的探針與克隆雜交來進行篩選。
2.長分散片段(long interspersed repeated segments,LINES)
重復序列的長度大于1000bp,平均長度為3500~5000bp,如KpnⅠ家族等。中度重復序列在基因組中所占比例在不同種屬之間差異很大,在人類基因組中約為12%。中度重復序列大多不編碼蛋白質。其功能可能類似于高度重復序列。有些中度重復序列則是編碼蛋白質或rRNA的結構基因,如HLA基因、rRNA基因、tRNA基因、組蛋白基因、免疫球蛋白基因等。中度重復序列可存在于結構基因之間、基因簇之中,甚至存在于內含子內部等。中度重復序列一般具有種屬特異性,因此在適當的情況下,可以應用它們作為探針以區分不同種屬哺乳動物細胞來源的DNA。
KpnⅠ家族
是中度重復順序中僅次于Alu家族的第二大家族,用限制性核酸內切酶KpnⅠ消化人類及其它靈長類動物的DNA,在電泳圖譜上可以看到4個不同長度的片段,分別為1.2、1.5、1.8和1.9kb,在人類基因組中,KpnⅠ家族的拷貝數約為3000~4800個,約占基因組的1%。
(2)組蛋白基因 在各種生物體內重復的次數不一樣,組蛋白基因沒有一定的排列方式,組蛋白基因不含內含子,組蛋白基因序列都很相似,從而編碼的組蛋白在結構上和功能上也極為相似,具有高的保守性。
(三)低度重復序列(單拷貝序列)
低度重復序列在單倍體基因組中只出現一次或數次,因而復性速度很慢。人基因組中,大約有 60%~65%
的序列屬于這一類。低度重復序列中儲存了巨大的遺傳信息,編碼各種不同功能的蛋白質。目前尚不清楚單拷貝基因的確切數字,在低度重復序列中只有一小部份用來編碼各種蛋白質,其他部份的功能尚不清楚。
五、多基因家族與假基因
(一) 多基因家族
多基因家族(multigene
family)是指由某一祖先基因經過重復和變異所產生的一組基因。多基因家族可分為兩類:①基因家族成簇地分布在某一條染色體上,其可同時發揮作用,合成某些蛋白質(如:組蛋白基因家族就成簇地集中在第7
q 32-6);②一個基因家族的不同成員成簇地分布在不同的染色體上,這些不同成員編碼一組功能上緊密相關的蛋白質(如珠蛋白基因家族)。
(二) 假基因
在多基因家族中,某些成員并不產生有功能的基因產物,這些基因稱為假基因(pseudo gene)。假基因與有功能的基因是同源的,原來可能也是有功能的基因,但由于缺失,倒位或點突變等,使這一基因失去活性,成為無功能的基因。
人們推測假基因的來源之一,可能是基因經過轉錄后生成的hnRNA通過剪接失去內含子形成mRNA,mRNA經逆轉錄產生cDNA,再整合到染色體DNA
中去,便有可能成為假基因,因此該假基因就沒有內含子,在這個過程中,可能同時會發生缺失,倒位或點突變等變化,從而使假基因失去表達活性。
六、多態性
基因組中某個基因在同種生物的不同個體中,同時和經常存在的兩種或兩種以上的變異型或基因型的現象,稱為基因多態性(gene polymorphism)。
真核生物基因組中基因多態性常常出現在限制性核酸內切酶的酶切位點序列中,因此,用某個限制性核酸內切酶來酶解基因組的某段序列時,在同種的不同個體之間該段序列可能被酶解成長短不等的幾個DNA片段,即這段序列在該種生物的群體中形成多態性,這種多態性稱為限制性核酸內切酶片段長度多態性(restriction
fragment length polymorphism,RFLP)。
RFLP分為兩種類型:一類是由于限制性內切酶位點上發生了單個堿基突變而使這一限制性位點發生丟失或獲得而產生的多態性,故稱之為點多態性(point
polymorphism)。這類多態性實際上是雙態的,即有(+)或無(-)。另一類是由于DNA分子內部發生較大的順序變化所致。這一類多態性又可以分成兩個亞類:第一亞類是DNA順序上發生突變如缺失、重復、插入。第二亞類是近幾年發現的所謂“高變區”。高變區(highly
variable
region),是由多個串聯重復順序組成的,不同的個體高變區內所串聯重復的拷貝數相差懸殊,因而高變區的長度變化很大,從而使高變區兩側限制性內切酶識別位點的固定位置隨高變區的大小而發生相對位移。所以這一類型的RFLP是由于高變區內串聯重復順序的拷貝數不同所產生的,其突出特征是限制性內切酶識別位點本身的堿基沒有發生改變,改變的只是它在基因組中的相對位置。