東南亞大陸的基因故事,首次集體講述
王曉波 | 撰文
東南亞大陸(Mainland Southeast Asia)位于東亞、南亞和東南亞島嶼部分的交匯處,又稱中南半島,包括緬甸、泰國、越南、老撾、柬埔寨和馬來西亞的馬來半島等地區(qū)。這里的語言、民族和人群極富多樣性,但在全球基因組學(xué)研究中長期代表不足——在已報道的全球67萬例人群全基因組測序數(shù)據(jù)中,東南亞人群樣本僅占1.57%。
5月14日,一項由中國科學(xué)院昆明動物研究所牽頭、泰國、柬埔寨等東南亞六國34個科研團隊參與的國際合作研究在《自然》發(fā)表[1],首次系統(tǒng)解析了該地區(qū)人群的遺傳結(jié)構(gòu)、演化歷史與環(huán)境適應(yīng),有效地填補了國際基因組數(shù)據(jù)庫的空白。
“從我們的基因組數(shù)據(jù)來看,地理隔離是解釋東南亞人群遺傳分化的主導(dǎo)因素。語言的形成和分化會比較復(fù)雜,人口擴散和文化同化應(yīng)該會共同發(fā)揮作用。”論文的通訊作者之一、中國科學(xué)院昆明動物研究所研究院宿兵告訴《賽先生》。
研究團隊花費十余年,深入東南亞大陸雨林腹地,采集了涵蓋五大語系、6個國家、30多個地方的東南亞人群樣本,完成了3023例深度全基因組測序,構(gòu)建了構(gòu)建了迄今為止最完整的東南亞人群高質(zhì)量全基因組變異數(shù)據(jù)庫——SEA3K。
在這些樣本中,研究人員以平均43.5倍深度完成了短讀長全基因組測序,并對40個代表性個體進行了平均32.7倍深度的長讀長測序。結(jié)果發(fā)現(xiàn),研究人員共識別出約8000萬個短序列變異和近10萬個結(jié)構(gòu)變異,其中有超過2000萬個短序列變異和近2.5萬個結(jié)構(gòu)變異是此前從未在東南亞人群中報道的新發(fā)現(xiàn)。
研究者通過主成分分析法發(fā)現(xiàn),大多數(shù)東南亞人群的遺傳結(jié)構(gòu)主要與地理分布格局高度一致,而不是隨語言分類聚類,這表明人群間的分化主要通過地理隔離形成,印證了該地區(qū)復(fù)雜的遺傳交融與語言更替歷史。
圖一:主成分分析法說明基因分化與地理距離高度相關(guān)
研究還揭示出構(gòu)成東亞與東南亞大陸人群的四種主要遺傳成分。一是東南亞土著中占主導(dǎo)地位的獨特古老成分,在柬埔寨及安達曼群島人群中尤為突出;二是從中國南方向南遷的農(nóng)業(yè)人群成分,與新石器時代農(nóng)業(yè)的擴散有關(guān);三是與東亞北部相關(guān)的成分,廣泛存在于藏族和中國西南非漢族人群中,反映了最近一次從中國西南向中南半島的人口遷移;四是廣泛分布于安達曼群島、孟加拉及中南半島各人群的古老成分。
“在東南亞群體中確實可以看到新石器時期北方南遷的農(nóng)業(yè)文明群體的遺傳混合印記,主要影響的是東南亞的主體民族。在土著人群中的主要成分是東南亞特有的、且比較古老的遺傳成分,可以稱之為東南亞的土著遺傳成分?!彼薇忉屨f。
他指出,這些發(fā)現(xiàn)有助于我們重新理解東南亞在現(xiàn)代人類演化史中的關(guān)鍵地位。第一,東南亞,包括中國西南部,可能是現(xiàn)代人最早到達亞洲東部的地區(qū),是人群早期遷徙的中轉(zhuǎn)站,因為東南亞土著人群的基因組中保留了亞洲祖先人群的遺傳印記;第二,目前的東南亞人群,基本上是遠古祖先人群和后來的農(nóng)業(yè)人群的混合。農(nóng)業(yè)文明從東亞大陸向東南亞擴散,對東南亞主體民族人群產(chǎn)生很大影響,但對土著人群影響相對有限。
2018年,《知識分子》的文章《史前傳奇:華南人群多次下南洋,改變東南亞人群基因構(gòu)成》曾報道,早在近代移民潮以前,史前時期的華南人群就曾多次南遷,并深刻改變了東南亞人群的基因構(gòu)成[2]。2021年,中國科學(xué)院古脊椎動物與古人類研究所付巧妹團隊也在Cell雜志報道了約9,000至6,000年前的廣西人群在農(nóng)業(yè)出現(xiàn)前已與來自東南亞的古老采集者和福建地區(qū)的南方祖源廣泛融合。[3]
圖二:人口樹得出組成中南半島人群的4種遺傳成分
此外,該研究還描繪了中南半島人群的演化史:所有東南亞大陸人群和東亞人群在15萬至20萬年前共享祖源,并在10萬至1萬年前的末次盛冰期經(jīng)歷了嚴重的瓶頸效應(yīng),人口一度減少到1000人左右。隨后,在農(nóng)業(yè)擴張驅(qū)動下,人口出現(xiàn)爆發(fā)式增長。
圖三:人口增長
作為世界上氣候最為多樣的區(qū)域之一,東南亞大陸的高溫高濕、密林密布環(huán)境,對人群演化產(chǎn)生了深遠影響。
研究團隊采用CMS評分方法,在東南亞大陸人群基因組中鑒定到44個受到強烈正選擇的區(qū)域,涉及89個基因,其中72個為首次發(fā)現(xiàn)的正選擇靶點。
這些基因涉及體質(zhì)、免疫、代謝等適應(yīng)性特征,揭示了東南亞人群應(yīng)對熱帶環(huán)境的獨特進化策略。例如,SLC245基因通過調(diào)控皮膚色素沉著抵御熱帶地區(qū)的強紫外環(huán)境,CDC42SE2可以減輕熱帶雨林地區(qū)蚊蟲叮咬反應(yīng),MRPS22基因促成的卷發(fā)表型可加速散熱等。值得注意的是,研究發(fā)現(xiàn)1號染色體上有一個長達443kb并在東南亞人群特異富集的基因組區(qū)域,該區(qū)域包含了與卷發(fā)相關(guān)的TCHHL1、TCHH等基因,以及與皮膚屏障相關(guān)的FLG等基因,進一步說明東南亞人群中受選擇的基因與熱帶雨林環(huán)境適應(yīng)密切相關(guān)。
同時,研究人員發(fā)現(xiàn)自然選擇在東南亞人群的基因組的調(diào)控序列和蛋白質(zhì)編碼區(qū)都起作用,但與生活在非洲熱帶雨林的人群在變異位點上存在顯著差異,反映了東南亞大陸土著人群在與非洲土著人群在趨同演化上的獨特性。
圖四:東南亞大陸人群基因組的自然選擇信號和潛在的環(huán)境適應(yīng)表型
現(xiàn)代人的基因組中依然保留著古人類的痕跡。在這項研究中,研究團隊發(fā)現(xiàn)東南亞大陸人群的尼安德特人基因占比介于東亞和南亞之間,而丹尼索瓦人基因和東亞人比例接近,但普遍高于南亞人群。
另外,研究還揭示出丹尼索瓦人與現(xiàn)代人之間存在多次滲入事件。23個被分析的人群中,13個人群顯示有單次滲入信號,而其他人群顯示至少兩次滲入信號。特別的是,有一個柬埔寨人群顯示有3次滲入事件。這些不同的基因滲入模式,支持此前關(guān)于“亞洲至少發(fā)生過兩次丹尼索瓦人與現(xiàn)代人混血事件”的觀點,表明有可能多個丹尼索瓦人支系在不同的時間,很可能在不同的區(qū)域和現(xiàn)代人類雜交。
圖五:尼安德特人基因和丹尼索瓦人基因?qū)|南亞大陸人的滲入
“這篇文章首先數(shù)據(jù)庫非常難得,針對東南亞族群不同的群體,對之后的研究非常關(guān)鍵;第二它發(fā)現(xiàn)的選擇適應(yīng)基因,尤其是跟東南亞特有環(huán)境相關(guān)的基因,以及和非洲人演化適應(yīng)過程的不同,也非常有意思;更重要的一點是,未來很有可能通過這樣的數(shù)據(jù),找到我們在現(xiàn)在人群還不知道的一些成分,很有意義?!敝袊茖W(xué)院古脊椎動物與古人類研究所研究員付巧妹評論說。
在首期聚焦東南亞大陸研究的基礎(chǔ)上,目前中國科學(xué)院昆明動物研究所聯(lián)合國際合作伙伴已正式啟動“東南亞基因組計劃”二期工程(SEA10K),致力于構(gòu)建覆蓋東南亞全域的萬人級高分辨率基因組圖譜。
隨著SEA10K的推進,我們或許能更全面地理解,什么造就了今天的亞洲人——以及我們從何而來。
參考文獻:
[1]Yaoxi He, et al., Genome diversity and signatures of natural selection in mainland Southeast Asia, Nature May 14th, 2025
[2]《知識分子》,2018,《史前傳奇:華南人群多次下南洋,改變東南亞人群基因構(gòu)成》,惠家明
[3]Tianyi Wang, et al., Human population history at the crossroads of East and Southeast Asia since 11,000 years ago, Cell, 2021