基因組所 于軍 研究員
12月21日出版的美國《科學(xué)》雜志提出2013年的6個值得關(guān)注的科學(xué)領(lǐng)域, 包括單細胞測序、“普朗克”探測微波背景輻射、人類連接組計劃、探索南極冰下世界、癌癥免疫療法和基礎(chǔ)植物研究。六個領(lǐng)域中的五個都與生命科學(xué)有關(guān)。
其中排在第一位,帶有最新理念的,就是“測定每一個細胞的序列”。從表面上看,測序好像僅僅是測定DNA的序列,也就是測定每一個細胞所攜帶的遺傳物質(zhì)—-DNA的序列。但是其實不然,背后有更深刻的意義。
首先,人體的每個細胞(單倍體細胞只有性決定細胞:精子和卵子)通常帶有兩套染色體(每條染色體由一個DNA分子和眾多蛋白質(zhì)分子輔助組成),而且每個個體所擁有的千兆個細胞都來自同一個受精卵,理論上來講,這些細胞的DNA序列應(yīng)該百分之百是一樣的。所不同的只是經(jīng)過每一代人的DNA復(fù)制,基因組(所有染色體)的總體序列會有幾十個變化,稱為每一代之間的基因組突變率。盡管這個變化相對每一代人來說是很少的,但是日積月累,加之世界人群之巨大,總體的變化數(shù)量則是驚人的!在這些變化中,又有人類個體生老病死等因素的不斷加入,基因和它的組分—-DNA序列也在世代的變演中或被保留、或被拋棄、甚至被夸大、抑或僅僅是隨波逐流。當然,這些存在于人群中的DNA序列變化也會與每個人引為自豪的優(yōu)勢有關(guān),也會與每個人不容樂觀的缺陷有關(guān),更會與我們的體能、長相、智慧、壽命、乃至疾病有關(guān)。這就是我們要測定更多人基因組序列的目的之一。我們要將基因組的這些變化與我們的“表型”(可見和可測定的標征)關(guān)聯(lián)起來,找到DNA序列與表型的因果關(guān)系,即所謂的全基因組關(guān)聯(lián)研究。
其次,既然基因組序列的變化與細胞的種類無關(guān),那我們還在乎單個細胞嗎?有一個最直接的原因,那就是各種惡性腫瘤細胞往往有自己特殊的變異。這些變異的發(fā)生有兩個基本的途徑:其一是固有的但是并不馬上致瘤,但潛力可畏;其二是腫瘤細胞新產(chǎn)生的,既可以定性,也可以定量,更可以用來指導(dǎo)診斷、預(yù)后和治療。還有些腫瘤相關(guān)的變異可以產(chǎn)生新(對,在正常狀態(tài)下沒有)的蛋白質(zhì),這些蛋白質(zhì)則可以作為藥靶來對待。另外,腫瘤細胞的特征之一是無限增殖,這里產(chǎn)生的變異之多,相關(guān)性之復(fù)雜都非常吸引人們?nèi)ド钊胙芯?。可見,單個細胞水平的研究會為腫瘤研究提供不少的腫瘤發(fā)生和不斷變演的線索。
第三,如果我們能測定每一個正常細胞的DNA序列,我們還會得到哪些有用的信息呢?答案是:很多。DNA測序歸根結(jié)底是一門技術(shù),一門非常有用的技術(shù)。盡管它的原理發(fā)明是上個世紀70年代的事情,但是“人類基因組計劃”的啟動賦予它新的動力和生命:我們要在這門技術(shù)的發(fā)展上投入很多很多的錢,就數(shù)量而言,可以說是空前絕后的:30億美元。結(jié)果是,這門技術(shù)不僅幫我們測定了一個人的基因組(也就是所謂“人類基因組計劃”)、數(shù)百個人的基因組(也就是所謂的“基因組單倍體型圖計劃”;該計劃粗略地測了幾百個人的基因組)、上千個人的基因組(即“1000人基因組計劃),乃至今天所談的:每個人的基因組和每個細胞的基因組。這個技術(shù)的發(fā)展之快,應(yīng)用之深廣,絕對是空前的。它對于科學(xué)發(fā)展的意義絕對超過航空母艦對現(xiàn)代戰(zhàn)爭的意義。
正是這樣一門技術(shù)支持了我們鑒別單細胞和單細胞功能差異的欲望。眾所周知,細胞是生命有機體的基本單元。人體就有近200種不同的細胞存在,有的在分化,有的在生長,有的在復(fù)制,有的在運動,有的在支撐機體,有的在傳導(dǎo)信號等等。問題是:既然每個人的每個細胞都有相同的基因組序列(或DNA分子),這些細胞在DNA序列上的不同體現(xiàn)在哪里呢?回答之一是:在RNA分子里面。RNA和DNA一樣是細胞的重要“建筑材料”之一。它們的功能也很復(fù)雜,有的相當于建筑材料,與蛋白質(zhì)一起構(gòu)成不同的功能結(jié)構(gòu);有的則編碼蛋白質(zhì),“指導(dǎo)”蛋白質(zhì)的合成;有的則是操作分子,參與很多細胞功能的調(diào)控,RNA可以說是“無孔不入”。也正是這些無孔不入的分子,才是細胞間非遺傳性差異的“始作俑者”。換句話說,細胞間的不同很大一部分是由它們的RNA內(nèi)涵所決定。這樣的話,用測定DNA的機器(通過將RNA“反轉(zhuǎn)錄”為DNA)來測定每細胞里的RNA組成正是單細胞測序的關(guān)鍵所在。每一個細胞里都有數(shù)千萬RNA分子。僅用來編碼蛋白質(zhì)的“信使RNA”(僅占總量1%)分子就有逾十萬種,近百萬之多??上攵?,強有力的測序技術(shù)此時此刻就更有了用武之地!
DNA測序技術(shù)在單細胞水平的應(yīng)用還不僅僅是如此。這里可以舉幾個實際的例子。一個是通過測定DNA序列來來找到重要調(diào)控蛋白質(zhì)與DNA 作用的部位(其實也是固定的序列),這個技術(shù)稱為ChIP-Seq(免疫沉淀-測序偶聯(lián))技術(shù),可以用來建立基因調(diào)控網(wǎng)絡(luò)(當然也包括致病基因在內(nèi)了)。還有一個是通過測定被蛋白質(zhì)保護的部分DNA來確定染色體在細胞核內(nèi)的三維構(gòu)像和空間分布。目前的研究結(jié)果表明不僅僅是染色體的穩(wěn)定性,而且它的構(gòu)像和時空分布會與細胞的分化、凋亡、癌變等有關(guān)。另外,我們還可以細究蛋白質(zhì)復(fù)合體(如核小體)的排列(包括排列的致密度和位置)來估計基因簇的被調(diào)控狀態(tài):協(xié)同、相左還是獨立?此類例子可以更多,甚至有更長的解釋??傊@些技術(shù)都可以在單細胞水平來觀察變化,疾病的一部分就體現(xiàn)在細胞水平基因調(diào)控的不正常。比如,胰島細胞(分泌胰島素)調(diào)控得不正常就導(dǎo)致糖尿病。又如,衰老個體的細胞和年輕個體的細胞在遺傳總體上和基因調(diào)控上有何不同?我們目前還沒有直接的手段來用實驗和數(shù)據(jù)來回答這個問題,或許在單個細胞水平的研究上這些問題都會迎刃而解。
就技術(shù)而言,單細胞測序的關(guān)鍵和特色至少有在四個方面體現(xiàn)出來。第一,我們必須要建立各種單細胞的觀察、觀測和分離技術(shù)。流式細胞儀是目前高通量分離細胞的工具之一,但是要做到分離和研究單個細胞,我們必須要有顯微處理的能力和相關(guān)儀器。微納加工技術(shù)和微流控技術(shù)的掌握和應(yīng)用應(yīng)該是不可少的。第二,我們要開發(fā)基于單細胞的DNA和RNA分離和分析技術(shù)。盡管DNA測序可以用擴增后的DNA來測序,但是無擴增技術(shù)會更好地體現(xiàn)細胞的原始狀態(tài)。第三,我們要建立單細胞基因表達和調(diào)控的數(shù)學(xué)計算模型。筆者在十幾年前曾與提出單細胞測序概念的胡德(Leroy Hood)教授切磋對“竭澤而漁”和“擲網(wǎng)而漁”之間的不同和邏輯關(guān)系的理解,筆者認為也許只有在“自然生態(tài)”下我們才能真正理解不同“魚兒”(基因)間的生存(功能)和依賴(相互作用)。因為細胞間的不同是絕對的,因為不僅不同的細胞不可能有相同的基因在表達譜(基因表達的全部),而且相同細胞的基因表達譜也會不同(視分辨率的不同而定)。因為細胞內(nèi)基因表達量的均值時小于一的。也就是說,細胞里有很多基因的表達量非常低,低到幾十、乃至幾百個細胞才有這個基因的一個轉(zhuǎn)錄本(拷貝)??梢姡瑔渭毎麥y序不是沒有挑戰(zhàn)的,不僅僅是技術(shù),而且包括理論。第四,達到在單細胞水平研究生命現(xiàn)象和基因的關(guān)系,我們極有必要將DNA測序技術(shù)推向單分子水平。這樣我們就舍去了DNA的擴增。目前的單分子DNA測序儀還不成熟,新的競爭還剛剛開始。單分子測序得優(yōu)勢在于我們不僅可以不用擴增地看到基因變異和表達的全貌,而且可以偵查到剛剛(實時)發(fā)生的微妙變化。更可以看到每個DNA分子和RNA分子上的化學(xué)修飾。因為我們知道DNA至少有四種化學(xué)修飾的狀態(tài),RNA 則含有少數(shù)(一百余種)化學(xué)修飾的核苷酸。由于不能容易地測定這些化學(xué)修飾核苷酸的存在和動態(tài)變化,我們無從知道它們在DNA和RNA分子上的準確功能。好在目前的測序技術(shù)允許我們粗略地知道哪些位點(序列的位置)可以有修飾的核苷酸存在,而且它們的動態(tài)變化被稱為是表觀遺傳學(xué)研究的內(nèi)容,有些甚至與癌變有關(guān)。&單細胞DNA測序的本質(zhì)是基因組學(xué)技術(shù)在細胞生物學(xué)上的應(yīng)用,這不僅充分體現(xiàn)了學(xué)科的交叉和互動,也指出了不可忽視基因組學(xué)技術(shù)的高速發(fā)展。就DNA測序技術(shù)而言,它的數(shù)據(jù)產(chǎn)生速度已經(jīng)超過了計算機的計算能力發(fā)展速度(摩爾定律)。很可惜的是,我國目前還沒有真正重視這一技術(shù)的發(fā)展。目前的研制焦點在第三代測序技術(shù),其特點為:單分子、讀長長、低成本。目前廣泛使用的是第二代設(shè)備,足以幫助我們測定各類基因組的序列,并且啟動前期單細胞水平的研究。&在科學(xué)上絕無一勞永逸的事件,只有一磚一瓦,只有起重與降落的周而復(fù)始,不知不覺中“科學(xué)的大廈”就拔地而起。在隨之聳入云端時,我們看到總是更遠和更廣,當然也就更美。到時候,我們會問自己:我們中國科學(xué)家所添加的那一塊磚、一塊瓦在哪里呢?新的一年,永遠鼓勵我們要有新的起點,我們2013年的新起點至少可以是第三代DNA測序技術(shù)的研發(fā),因為單細胞測序終極目標的實現(xiàn)需要新一代測序儀的支持:測定每個(正常的和疾病的)細胞里每一個DNA和RNA分子的精準序列。