關(guān)鍵詞: 基因定位 熒光原位雜交 放射雜交體
在人類基因組計劃(HGP)中有二大部分內(nèi)容,一是在2005年之前完成對人類基因組DNA約3×109個核苷酸序列的測定,同時完成對基因的染色體定位工作;二是開展基因功能的研究;蚨ㄎ慌c基因序列兩者相輔相成,基因染色體的定位既有助于基因序列的測定,又有利于對基因結(jié)構(gòu)和功能的研究,有利于進一步提示生物的遺傳信息;驕y序技術(shù),尤其是大規(guī)模測序技術(shù)的建立,極大地提高了基因測序的速度。到1999年1月25日為止,全世界已測出全部人類基因序列的7.3%,而部分生物,如酵母、大腸桿菌等的序列已全部測定完畢,這樣cDNA的染色體定位工作就顯得尤為迫切。然而由于目前的基因大規(guī)模測序是建立在基因定位的基礎(chǔ)之上,而基因組的染色體定位(基因作圖)工作跟不上基因測序技術(shù)的發(fā)展,因而成了限制基因序列測定的主要因素;虻娜旧w定位方法多種多樣,它可分為基因的遺傳作圖和物理作圖,而物理作圖中最主要是熒光原位雜交(FISH)和放射雜交體(RH)二種。本文就目前主要的幾種基因作圖方法作一介紹。 1 熒光原位雜交(FISH) 原位雜交(ISH)原早被用于染色體組型和核酸分布的分析,后來,隨著技術(shù)的發(fā)展,它被用于基因染色體定位的研究,特別是非同位素標(biāo)記技術(shù)的發(fā)展,使得ISH的應(yīng)用日前廣泛。目前它已被用于腫瘤的細胞遺傳改變、人類的早期發(fā)育、核與基因組的分子結(jié)構(gòu)、不同種屬間的基因圖譜比較、動物的細胞發(fā)生和無數(shù)的基因定位研究。用于基因染色體定位的FISH已被稱為CO-FISH或COD-FISH(chromosome orientation and direction FISH)[1]。 CO-FISH技術(shù)是以生物素或地高辛等半抗原為標(biāo)記物,采用隨機引物法或缺口平移法標(biāo)記DNA探針,將探針變性后即可用于細胞分裂中期或間期細胞核染色體的原位雜交并產(chǎn)生DNA-DNA雜交體,這種雜交體可以被與半抗原有高度親和力的熒光標(biāo)記分子所檢測到,而這種雜交信號又可以被與熒光分子偶聯(lián)的單抗所放大。此外,DNA探針也可以直接標(biāo)以熒光分子,這些熒光分子有:FITC、德克薩斯紅(texas red )及最近開發(fā)的花青染料(cyanine dyes)等,如果這樣,就不需要進行信號檢測和放大就可以直接觀察DNA-DNA雜交體[2]。用于FISH的DNA底物已經(jīng)由原先固定的染色體和間期細胞核發(fā)展到伸展的單鏈DNA分子、細胞核及染色體的自然形態(tài)等[3]。由于FISH技術(shù)已經(jīng)可以在伸展的DNA分子上進行,這樣它的分辨率就達到1~2kb,并能在此區(qū)域內(nèi)作圖。而傳統(tǒng)的在細胞中期和間期進行的FISH只能分別分辨1~5Mb和50kb左右的區(qū)域,分辨率的提高使得更詳細的基因結(jié)構(gòu)和基因內(nèi)重排研究成為可能;FISH對自然狀態(tài)下細胞和染色體的研究可以闡明核成分的分布并且不會出現(xiàn)象計算機三維重建分析時的干擾現(xiàn)象;同時,還能對二條同源染色體轉(zhuǎn)錄活性的核功能進行研究,并可直接觀察基因表達過程中核成分的位置。FISH不僅能對固定的標(biāo)本進行研究,還能對新鮮的標(biāo)本進行研究,更有報道認為它能分辨單一堿基的替換[4]。 用于基因定位的FISH技術(shù)經(jīng)歷了從用洗滌劑或堿裂解液處理細胞核產(chǎn)生伸展?fàn)钊旧|(zhì),從機械拉展染色質(zhì)到分子梳,再到最近的動態(tài)分子梳技術(shù)(dynamic moleular combing DMC)[5]。DMC技術(shù)是分子梳技術(shù)和熒光雜交技術(shù)的結(jié)合,它分為四個步驟:①制備三氯硅烷包被的玻片;②從低熔點瓊脂糖膠中制備DNA溶液;③將玻片浸于溶液里5分鐘,使DNA結(jié)合到玻片上;④用300μm/s的速度將玻片從溶液中抽出。由于在玻片-溶液界面處,浸在溶液中的部分對已抽出部分有一種持續(xù)的回復(fù)力,加上它們的疏水性,硅烷的表面很快就干燥,使得被拉長的DNA纖維不可逆地被固定于玻片表面,這種DNA纖維呈平等狀、單方向分布,似梳子狀。整個表面的伸展是均一的(2kb/μm),它不受DNA片段大小的影響。與其它方法相比,DMC技術(shù)有如下優(yōu)點:①在整個平面的伸展可使雜交信號為單一信號,無需標(biāo)化。②不同的表面和不同的溶液中DNA的伸展無變化。③高密度的基因組DNA和雜交信號可使統(tǒng)計分析在一張22×22mm的載玻片上即可進行。④一定的DNA斷裂可產(chǎn)生持續(xù)的可分析數(shù)百kb的DNA片段。⑤可從同一種DNA溶液中制備出許多伸展平面。 2 放射雜交體法(RH) 盡管FISH技術(shù)可以對基因進行染色定位,但是從分子角度來看,它的定位工作仍顯得較粗糙,它只能將基因定位于百萬個堿基的范圍(2%的染色體長度)。因此發(fā)展一種較敏感的技術(shù)勢在必行。RH就是在這樣的情況下產(chǎn)生的,它的基礎(chǔ)是Goss和Harris早期的工作,他們用大劑量的X射線照射細胞,使染色體斷裂;但是通過細胞融合嚙齒動物細胞DNA中并被其修復(fù)。在染色體上間隔越遠的兩個標(biāo)記,越容易被X射線所打斷從而分離,出現(xiàn)在受體細胞的基因組DNA的不同位點。大約通過對100個這種染色體被修復(fù)的融合細胞克隆DNA的標(biāo)記間斷裂頻率和距離的分析,就可得出這些標(biāo)記在其自身染色體上的位置[6,7]。 然而,RH法作圖是建立在統(tǒng)計基礎(chǔ)上,因此,由RH法確定的遺傳圖譜并不一定真正代表標(biāo)記物在染色體上的位置,所以建立一種特定順序相對性的測量方法顯得十分必要。Cox等人對作了研究。他們不用二倍體的細胞而采用只含單一染色體的單倍體細胞,得到了較好的效果。由于RH法作圖并不依賴于靶染色體上可供選擇的標(biāo)記物的有無,因此在理論上它可以對細胞中單一拷貝的染色體進行分析;此外,RH另一個特點是它的圖譜精度可以由X線折照射劑量來控制,一般來說,8000rad的劑量比較適中[8]。 上述這種RH方法又稱為照射融合基因轉(zhuǎn)移技術(shù)(irradiation and fusion gene transfer,IFGT), 這種方法比較繁鎖,每條染色體需要100~200個雜交體細胞,這樣人的整個基因組就需要4000個雜交細胞體。Walter等人就此作了改進,他們不用嚙齒動物細胞雜交體,而是采用二倍體的成纖維細胞,并將改進后的方法稱之為全基因組照射融合基因轉(zhuǎn)移放射雜交體法(whole genome irradiation and fusion gene transfer radiation hybuids,WGRHs)[9]。他們只需44個細胞克隆即可以對對整條染色體進行定們分析,而且這種方法可以對大量的樣本進行分析,大大減少了工作量和提高了工作效率。 目前已有商品化的小鼠全基因放射雜交體板可供使用,這種板由Goodfellow博士的實驗室構(gòu)建,他們是將照射后的小鼠129胚細胞與TK-A23倉鼠細胞系融合[10]。 3 脈沖場凝膠電泳(PFGE) 小的DNA分子(<30~40kb)在瓊脂糖凝膠電泳中的泳動速度與其大小的對數(shù)成反比,而大的DNA分子其泳動速度卻與其大小無關(guān),只與電泳材料的孔徑有關(guān)。由此Schwartz等提出改變電泳或電場的方法可達到分離大分子DNA的目的[11]。它需要提取大分子量的DNA,再用稀有切割酶將DNA切成50kb以上的高分子量DNA。由于稀有切割酶的識別位點多為6個堿基,而其中又往往含有CpG二核苷酸。因為CpG二核苷酸多以甲基化的形式存在于脊椎動物基因組中,易于脫氨和發(fā)生C→T轉(zhuǎn)化突變;這種情況多在脊椎動物已知的看家基因5’出現(xiàn),~40%的基因有組織特異性表達;這樣如果在基因組DNA中檢測到一個稀有切割酶識別位點,在很大程度上就可以認為是一個CpG島和一個基因的5’端。此外,基因組DNA的甲基化是組織和發(fā)育階段特異性且經(jīng)常甲基化不完全,這樣用稀有切割酶切割就產(chǎn)生消化不全現(xiàn)象,不同的甲基化類型具有不同的消化產(chǎn)物,在PFGE電泳上就可區(qū)分出個體的不同組織、不同個體的同一組織、不同種類的個體和由體細胞雜交制備的DNA等[12]。 PFGE可以產(chǎn)生涵蓋50kb到5Mb的基因組圖譜,但它比較繁鎖和工作量較大。稀有酶的缺乏和稀有切割分布的隨機性使得PFGEF方法難以排列數(shù)百kb以上的序列。 4 Contig拼接(contig assembly)和染色體步移(chromosome walking) 正如象多態(tài)微衛(wèi)星的出現(xiàn)使基因作圖產(chǎn)生革命性變化一樣,YACs之類大基因片段(>100kb)的成功分離,使得眾多哺乳動物基因組物理標(biāo)簽和長距離圖譜的構(gòu)建成為可能。目前構(gòu)建YAC文庫的載體多為標(biāo)準(zhǔn)的pYAC4載體,它含有著絲粒和端粒以保證染色體在酵母細胞中呈穩(wěn)定的線性分子。極高分子量的基因組DNA就插入在選擇載體的臂之間,連接的人工染色體導(dǎo)入酵母的原生質(zhì)體中復(fù)制并保持穩(wěn)定。YACs中插入片段的長度在500kb~1Mb之間,它足以被用于物理作圖。目前用于YAC文庫篩選的方法基于二種基本技術(shù):①是PCR技術(shù)[13],②是雜交技術(shù)[14]。盡管雜交技術(shù)有其特點,但其信號低、重復(fù)元件產(chǎn)生的高背景及技術(shù)要求高等缺點,使得它已漸漸被PCR方法所淘汰。尤其是IRS-PCR(interspersed repetitive sequence PCR)的出現(xiàn),更使PCR在其中的優(yōu)勢得到充分體現(xiàn)[15]。一旦YAC的末端被分離,接下來的關(guān)鍵是確定二個末端是否與預(yù)期的標(biāo)簽相匹配,由于被分離的YAC末端極少適合于FISH,故只能用Southern雜交;如果這個末端測序后可作為STS(sequence tag site)的話,也可以用PCR的方法進行鑒定。而最簡單的方法是通過contig標(biāo)簽與已知YAC比較來確定新YAC的位置;如果這個不行的話,可將末端與體細胞雜交體或放射雜交體板、基因組PFGE圖譜等一起分析[16]。 由于YAC克隆存在的一些缺點,如嵌合和重組等,現(xiàn)在又發(fā)展了細菌人工染色體(bacterial artificial chromosome,BAC)、噬菌體P1克隆系統(tǒng)和P1衍生的人工染色體(P1-derived artificial chromosome,PACs)等,這些質(zhì)粒均是在細菌中進行繁殖,易于轉(zhuǎn)導(dǎo),可對插入末端進行直接測序,有關(guān)這些系統(tǒng)的詳細情況可從http://bacpac.med.buffalo.edu.中獲得。目前BACs和PACs已成為基因組計劃的“序列準(zhǔn)備”模板(sequence-ready template)。利用文庫構(gòu)建整條染色體或基因組的物理圖譜主要采用二種方法:一是使用含有STS的圖譜,根據(jù)有序的、重疊的STS構(gòu)建,它的首要前提是高密度、具有良好順序的STS圖譜;二是通過建立大的標(biāo)簽進行指紋分析。利用PCR和雜交,再結(jié)合限制酶消化,即可進行染色體步移。 5 基因定位克。╬ositional cloning) 基因定位克隆即是一種基因克隆的方法,同時又是一種基因定位方法。一些與遺傳病相關(guān)基因的克隆多采用這種方法,它先根據(jù)已知的遺傳標(biāo)記進行連鎖分析和系譜分析,先確定候選基因所在的位置,再通過其它方法獲得基因的全部序列;虻倪z傳連鎖分析原理可參閱文獻[17]。大規(guī)模遺傳連鎖分析所需的計算機軟件可以從下列網(wǎng)址中獲得:http://www.genome.wi.mit.edu/genome-software;突變表型資源庫在:http://www.resgen.com和http://www.genome.wi.mit.edu。 基因定位克隆中獲得基因序列的方法大致有[18]:①對關(guān)鍵部位進行直接測序,目前已經(jīng)可以對500kb左右的區(qū)域進行直接測序;②比較基因組作圖和測序,具體原理在下面講述,有關(guān)的信息可從http://www.ncbi.nlm.nih.gov/XREFdb/中得到;③位置候選分析(positional candidate analysis),從某種程度上講,它將成為基因定位克隆的標(biāo)準(zhǔn)步驟,它是在被克隆的基因(往往是ESTs形式)和它們相應(yīng)的染色體位置日前收錄在:http://www-shgc/stanford.edu/cgi-bin/smsg#GOTO;④基因結(jié)構(gòu)特征分析,這方面主要有三種方法:HTF島作圖(非甲基化CpG二核苷酸)、進化保守區(qū)分析和外顯子捕獲。HTF作圖法根據(jù)的是稀有切割酶對基因組DNA的特征性切割,產(chǎn)生可識別的標(biāo)記,如基因的5’端和CpG二核苷酸等,有人又稱這為限制性標(biāo)記基因組掃描(restriction landmark genome scanning,RLGS)[19];⑤cDNA捕獲,它是根據(jù)基因組DNA和已知cDNA序列同源,它們就能形成異二聚體。這樣將二者接上接頭雜交后,再經(jīng)過PCR擴增等即可得到未知基因。 6 比較基因作圖(comparative gene mapping)或比較物理圖譜(comparative physical maps) 基因非編碼區(qū)的進化明顯比編碼區(qū)快得多,通過對不同種已知基因的比較可以發(fā)現(xiàn),不同種屬的基因編碼區(qū)有相當(dāng)高的同源性,因此可以利用這個特性進行基因作圖和基因定位。也就是說,一旦某一性狀被定位于動物染色體的一特定區(qū)域,這些信息(附近的ESTs和候選基因等)也可以移植到人的相應(yīng)區(qū)域;同時,對一些不能在人體進行的致死性狀的研究可以在動物染色體上定位后,再映射到人類染色體的相應(yīng)位點。在這方面比較新的方法是L-yons等人的比較錨定標(biāo)簽序列(comparative anchor-tagged sequence,CATS)[20]和Marklund等人的異種二聚體分析(xenoduplex analysis)[21]。CATS擴增不同脊椎動物的相同編碼序列,比較適合于對單一外顯子的擴增,由于進行連鎖分析的遺傳多態(tài)性在較短的編碼區(qū)內(nèi)比較難發(fā)現(xiàn),且CATS擴增出來的序列長度一致,限制了體細胞雜交體圖譜的構(gòu)建,要克服這些困難又要花費大量的人力物力。異種二聚體分析是在CATS基礎(chǔ)上改進變而成,它是將不同物種的PCR產(chǎn)物混在一起進行變性、復(fù)性,這樣同源的二條鏈就可雜交在一起,通過聚丙烯酰胺凝膠電泳分離出異種雜交體進行分析,采用體細胞雜交體(SCH)作圖法作圖。 7 其它 關(guān)于基因的染色體定位尚有不少其它的方法,不過這些方法幾乎均與上述介紹的方法相關(guān),或者是與以下的一些方法結(jié)合,如:顯微分割法(microdissection)、熒光活化細胞分選方法(fluorescenceactivated cell sorting,FACS)、變性寡核苷酸引物PCR(degenerate oligonucleotide primer PCR,DOP-PCR)、體細胞雜交體(interspersed repetitive sequence PCR,IRS-PCR)等[16,22]。
參考文獻 [1] Meyne J et al.Methods in Molecular Biology,Vol 33:In Situ Hybridization protocols.Choo KHA ed.Humana Press Inc.Totowa,NJ ,1994. [2] Ekong R et al.Curr Opion Biotechnol,1998,9:19-24. [3] Bass HW et al.J Cell Biol ,1997,137:5-18. [4] Nilsson M et al.Nat Genet,1997,16:252-255. [5] Michalet X et al.Science,1997,277:1518-1523. [6] Goss SJ et al.Nature,1975,255:680-684. [7] Goss SJ et al.J Cell Sci,1997,25:17-37. [8] Cox DR et al.Science,1990,250:245-250. [9] Walter MA et al.Nat Genet,1996,7:22-28. [10] Schitt K et al.Genomics,1996,34:193-197. [11] Schwartz DC et al.Cell,1984,37:67-75. [12] Cross SH et al.Curr Opin Genet Dev,19995,5:309-314. [13] Green ED.PNAS,1990,87:1213-1217. [14] Larin Z.Genet Res,1990,56:203-208. [15] Hunter KW et al.Mamm Genome,1994,5:597-607. [16] Herman GE.Methods,1998,14:135-151. [17] Boyd Y.Methods,1998,14:135-151. [18] Boehm T.Methods,1998,14:152-158. [19] Okazaki Y.Methods,1997,13:359-377. [20] Lyons LA.et al.Nature Genet,1997,15:47-56. [21] Marklund L et al.Genome Res,1998,8:399-403. [22] Genome mapping:A practical approach.Dear PH ed.IRS Press, New youk,1997,p125-198.
... |