近日,牛津大學大數據研究所的科學家在繪制人類之間的全部遺傳關系圖方面邁出了重要的一步,即創造除了一個單一的家譜,可以追溯我們所有人的祖先。該研究已于2月24日發表在《科學》期刊上。
在過去的二十年中,人類基因研究取得了非凡的進步,為數十萬人(包括數千名史前人)生成了基因組數據。這提出了更加令人興奮的可能性,即追蹤人類遺傳多樣性的起源,以生成世界各地個體如何相互關聯的完整地圖。
到目前為止,這一愿景的主要挑戰是找到一種方法來組合來自許多不同數據庫的基因組序列,并開發算法來處理這種規模的數據。然而,牛津大學大數據研究所的研究人員現在發布了一種新方法,可以輕松地組合來自多方的數據并進行擴展,以適應數百萬個基因組序列。
新研究整合了來自8個不同數據庫的現代和古代人類基因組數據,包括來自215個人群的總共3609個個體基因組序列。古代基因組包括在世界各地發現的年齡從1000到100000歲不等的樣本。算法預測了進化樹中必須存在共同祖先的位置,以解釋遺傳變異的模式。由此產生的網絡包含近2700萬個祖先。
在這些樣本基因組上添加位置數據后,研究人員使用該網絡來估計預測的共同祖先居住的地方。最終結果是,成功地重現了人類進化史上的關鍵事件,包括走出非洲。
研究小組表示,后續將通過繼續整合可用的遺傳數據,使家譜圖更加全面。由于樹序列以高效的方式存儲數據,因此數據集可輕松容納數百萬個額外的基因組。
研究作者黃燕博士說:“這項研究正在為下一代DNA測序奠定基礎。隨著現代和古代DNA樣本基因組序列質量的提高,樹序列將變得更加準確,我們最終將能夠生成一張統一的圖譜,解釋我們今天看到的所有人類遺傳變異的起源。”
前瞻經濟學人APP資訊組
論文原文:https://www.science.org/doi/10.1126/science.abi8264
標簽: 人類家譜