人類基因組計劃20年后,我們開始覬覦“上帝”的角色
圖片來自bitchute.com
20年前,我們對基因的了解還很有限,以至于當(dāng)人類基因組草圖公布的時候,引起了全球的矚目,從電視到報紙,媒體在連篇累牘地報道該事件。20年之后的今天,我們不再滿足于發(fā)現(xiàn)新的基因,而是編輯或改寫基因,了解人的生老病死,改良作物品種,我們甚至還創(chuàng)造出了此前從未出現(xiàn)過的基因。從某種程度上來講,我們在扮演造物主的角色。
本文就帶你回顧當(dāng)年激動人心的人類基因組計劃,它是如何從一個雄心勃勃的開端,走到躊躇不前、困難重重的中間,最后還是取得了一個皆大歡喜的結(jié)果。下一個20年,我們能對基因做些什么,會有哪些驚喜的發(fā)現(xiàn)?
撰文 | 計永勝
責(zé)編 | 葉水送
2021年2月,《科學(xué)》(2月5日)和《自然》(2月11日)雜志出版人類基因組計劃??约o念人類基因組草圖發(fā)表20周年。
1953年,克里克和沃森發(fā)現(xiàn)DNA的雙螺旋結(jié)構(gòu);1977年,沃特·吉爾伯特(Walter Gilbert)和弗雷德里克·桑格(Frederick Sanger)發(fā)明了DNA測序的方法。
基因組學(xué)研究里程碑事件,圖片來自lehigh.edu
隨后,包括EBV病毒在內(nèi)的一些簡單生物的DNA序列被測序成功。雖然有一些科學(xué)家建議對人類基因組進行測序,但面對人類基因組30億堿基對的龐大規(guī)模,持續(xù)性的研究經(jīng)費成為擺在研究人員面前的難題。
1986年3月,美國能源部(DOE)在新墨西哥州的圣塔菲(Santa Fe)召開會議,討論人類基因組測序計劃。諾貝爾生理或醫(yī)學(xué)獎獲得者羅納托·杜爾貝科 (Renato Dulbecco)在《科學(xué)》雜志發(fā)表文章指出,對人類基因組的測序?qū)⒊蔀槟[瘤研究的關(guān)鍵轉(zhuǎn)折點。
同年6月,加州理工學(xué)院萊諾·伊·胡德(Leroy E. Hood,1987年的拉斯克醫(yī)學(xué)獎獲得者)和勞埃德·史密斯(Lloyd Smith)改進了程序繁瑣的Sanger測序法,發(fā)明了世界上第一臺DNA自動測序儀。
可以說,不管是從現(xiàn)實需要還是技術(shù)支持,對人類基因組進行測序的時機已經(jīng)相對成熟。
1990年4月,美國國立衛(wèi)生研究院(NIH)和能源部共同發(fā)布人類基因組5年計劃,該計劃包括人類及模式生物基因組的測序和圖譜繪制、數(shù)據(jù)收集和分析支持(算法改進、軟件設(shè)計開發(fā)等)、技術(shù)研發(fā)和轉(zhuǎn)讓等。
同年8月,NIH開始對四種模式生物進行基因組大規(guī)模測序,包括山羊支原體(Mycoplasma capricolum)、大腸桿菌(Escherichia coli)、秀麗隱桿線蟲(Caenorhabditis elegans)和釀酒酵母(Saccharomyces cerevisiae)。兩個月后,NIH和能源部“對了對時鐘”,正式宣布10月1日為“人類基因組計劃”官方正式起始時間。
自此,先后由美國、英國、法國、德國、日本和我國科學(xué)家共同參與、被譽為生命科學(xué)“登月計劃”的“人類基因組計劃”正式踏上征程,這一走就是將近13年。
當(dāng)然,這期間也出現(xiàn)一些“插曲”,例如生物學(xué)家、“科學(xué)狂人”克雷格·文特爾(John Craig Venter)因為與“人類基因組計劃”團隊在基因組測序數(shù)據(jù)分享政策方面存在分歧,一氣之下離開了NIH,并于1998年5月成立賽萊拉(Celera)生物技術(shù)公司,宣稱將在3年內(nèi)完成人類基因組測序工作。于是NIH不得不提高效率,加快進度,以免被文特爾搶先。實際上,這種“競爭”也推動了“人類基因組計劃”更加快捷地進行。
最終的結(jié)果還是皆大歡喜的(注:在很多人看來,賽萊拉贏得了這場競賽),國際人類基因組測序聯(lián)盟和賽萊拉生物技術(shù)公司分別于2001年2月15日和2001年2月16日在《自然》和《科學(xué)》雜志發(fā)表人類基因組草圖。
克林頓宣布人類基因草圖完成,圖片來自heterodoxology.com
“人類基因組計劃”最終完成是在2003年4月,宣告“后基因組時代”到來。那么,“人類基因組計劃”對當(dāng)今科學(xué)研究有哪些影響?
美國西北大學(xué)網(wǎng)絡(luò)科學(xué)研究所亞歷山大·蓋茨(Alexander J. Gates)等人在2月11日《自然》雜志撰文指出,“人類基因組計劃”大大提升了我們對基因及其調(diào)控元件的認識,并協(xié)助研究人員確定眾多藥物的靶點[1]。
“人類基因組計劃”最顯著的特點就是數(shù)據(jù)量龐大,項目實施的13年中,得到“注釋”的基因數(shù)量迅猛增加。自2001年開始,每年關(guān)于蛋白編碼基因的學(xué)術(shù)論文數(shù)量在10000到20000篇,只要集中在CD4、TP53、TNF和EGFR等明星基因上。這都得益于“人類基因組計劃”將數(shù)據(jù)獲取方式由“單鉤釣魚”改為“細網(wǎng)撈魚”。
近30年,數(shù)個人類“明星基因”論文發(fā)表趨勢,從圖中可看到HPG計劃成功后,論文發(fā)表數(shù)量猛增
“人類基因組計劃”還進一步確定了基因組中非編碼序列的生物重要性。這些序列的改變不會影響蛋白的序列,但會干擾蛋白表達的網(wǎng)絡(luò),進而影響生物學(xué)功能。
2000年之后,科學(xué)家對基因非編碼區(qū)域的了解興趣一直未減
在2001年之前,明確某種藥物全部蛋白靶點的概率不到50%?!叭祟惢蚪M計劃”完成后,美國每年通過的藥物幾乎都有清楚的作用靶點說明。
“人類基因組計劃”不僅促進了生物學(xué)和生物醫(yī)學(xué)的發(fā)展,而且積極深化了多學(xué)科合作的“大科學(xué)”融合。
自本世紀初,信息科學(xué)和計算機科學(xué)的發(fā)展更加迅速,“人類基因組計劃”就是遺傳學(xué)、生物化學(xué)、分子生物學(xué)和信息科學(xué)深度合作的成功案例,此后各類“組學(xué)”出現(xiàn),共同構(gòu)建生命科學(xué)的“大數(shù)據(jù)”時代。
與此同時,隨著計算機算法的不斷更新迭代、測序成本的逐漸降低,個人基因組學(xué)正在走進人們的日常生活?;蚪M測序的大眾化更有助于我們了解人類自身遺傳的多樣性,最終服務(wù)醫(yī)學(xué)發(fā)展,保障人類健康。
20年后,當(dāng)我們回顧人類基因組計劃時,人類已不再滿足發(fā)現(xiàn)基因,而是修飾基因、編輯基因,甚至是創(chuàng)造一個此前從未出現(xiàn)過的基因。下一個20年,我們還能對這些人類基本的遺傳單元做些什么呢?至少我們已感受到了當(dāng)下基因治療正如日中天地發(fā)展著,我們正在收獲“人類基因組計劃”當(dāng)年播撒的果實。
“
作者簡介
計永勝,中國科學(xué)技術(shù)大學(xué)生命科學(xué)與醫(yī)學(xué)部青年講師,曾擔(dān)任安徽醫(yī)科大學(xué)副教授,威斯康星醫(yī)學(xué)院癌癥中心做博士后。
”
參考資料
Alexander J. Gates, Deisy Morselli Gysi,Manolis Kellis & Albert-László Barabási.A wealth of discovery built on the HumanGenome Project — by the numbers. Nature 590, 212-215 (2021). doi:https://doi.org/10.1038/d41586-021-00314-6
制版編輯 | Morgan