人類首個Y染色體完整序列問世!補齊最后一塊基因拼圖|Nature
豐色 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
終于,人類Y染色體的完整序列被科學(xué)家弄清楚了。
這意味著,人類泛基因組的最后一塊拼圖被拼上。
這項重磅研究刊登在最新一期Nature之上。
該序列提供了人類Y染色體完整的62,460,029個堿基對。
其中有30,000,000個是本次新發(fā)現(xiàn)的,上面帶有41個額外的蛋白質(zhì)編碼基因。
它將對我們研究繁殖(比如Y染色體導(dǎo)致的不孕不育)、進化、癌癥等重要問題提供方向。
作者表示:
幾年前人類Y染色體序列還存在一半缺失,并且都是非常難以摸清的DNA(比如衛(wèi)星DNA)。
當時我們甚至都懷疑它們是否還能測出來。
現(xiàn)在的發(fā)現(xiàn)真的是一個巨大的轉(zhuǎn)變。
Ps. 完整序列可在UCSC大學(xué)基因組瀏覽器上查閱和使用,通過Github訪問也可。
科學(xué)家首次發(fā)布人類Y染色體完整序列科學(xué)家和臨床醫(yī)生研究基因組的目的之一,就是通過將個體的DNA與標準的參考DNA進行比較,確定哪里存在變異。
今天我們的主角:Y染色體,它最廣為人知的功能是確定男性性別(其實也會出現(xiàn)在雙性人中)。
但實際遠不止此。
一些男性的某些細胞如果缺失了這一染色體,就會面臨癌癥、阿爾茨海默病等疾病纏身的風(fēng)險。
因此,一個完整的Y染色體序列能夠使科學(xué)家更好地了解它在人體內(nèi)發(fā)揮的所有作用。
然而,即使是最新的參考序列(GRCh38)也都還有一半以上的Y染色體缺失,這使得我們理解變異和相關(guān)疾病十分困難。
而之所以科學(xué)家很難破解完整的序列,是因為該染色體機構(gòu)中的一些DNA是回文形式的(順讀和反讀都一樣,且跨越了超一百萬個堿基對)。
此外,還有很大一部分DNA是衛(wèi)星DNA,也就是大型、高度重讀的非蛋白質(zhì)編碼區(qū)域。
一旦兩個衛(wèi)星DNA相互連接,測序過程就會進一步復(fù)雜化。
現(xiàn)在,得益于長讀(long-read)測序技術(shù)和新的計算組裝方法進步到能夠處理重復(fù)序列,并將序列中的原始數(shù)據(jù)轉(zhuǎn)換為某種可用的信息,研究人員終于實現(xiàn)了Y染色體的無縫讀取。
在此,他們解決了幾個關(guān)鍵挑戰(zhàn),比如精確定位回文序列中發(fā)生倒位的位置。
——這里的“他們”指的是T2T聯(lián)盟,一個專門研究Y染色體的國際小組,2018年成立,領(lǐng)導(dǎo)者包括加州大學(xué)圣克魯斯分校(UCSC)生物分子助理教授Karen Miga。
T2T聯(lián)盟之前就發(fā)布了人類Y染色體著絲粒(即染色體兩半連接在一起的區(qū)域)的第一個序列,共涉及30萬個堿基對。
現(xiàn)在,僅僅經(jīng)過5年時間,他們發(fā)現(xiàn)了新的3000萬個堿基對,破解了Y染色體的全部序列。
該結(jié)果意義何在?
首先是在生殖方面。
雖然Y染色體上的基因相對較少,但都很復(fù)雜且動態(tài),并且編碼重要的功能,例如精子的產(chǎn)生。
完整的Y染色體參考序列將使科學(xué)家能夠以前所未有的方式研究人類基因組這部分的無數(shù)特征,弄清與Y染色體相關(guān)的疾病(比如精子生成不足導(dǎo)致的不孕)將變得更加容易。
另外,復(fù)雜的結(jié)構(gòu)導(dǎo)致Y染色體是人類甚至類人猿中變化最快的染色體。
也就是說兩個健康人的Y染色體可能看起來非常不同,比如一個人擁有一個基因的40個拷貝,而另一個人僅19個。
完整的參考序列則能夠更好的研究這種進化。
UCSC表示,體外受精機構(gòu)或其他不孕癥研究的未來焦點可能就將聚焦于此。
其次,對于人類種群進化和遷移研究來說,它也是非常重要的資源。
因為Y染色體在一組遺傳物質(zhì)中代代相傳,在該組遺傳物質(zhì)之外則很少發(fā)生重組,而人類X染色體上的常染色體和基因則經(jīng)常重組并彼此共享遺傳物質(zhì),不方便進行代際遺傳中的基因追蹤等研究。
此外,這項成果對衛(wèi)星DNA的一些謎題也有幫助。
以及此前有研究表明,隨著年齡的增長,攜帶Y染色體的人可能會失去部分或全部遺傳物質(zhì),但科學(xué)家們從未完全理解為什么會發(fā)生這種情況以及它可能產(chǎn)生的影響。
完整的Y染色體序列可能有助于解開這個謎團。
還有一個意外的發(fā)現(xiàn)本研究的成果也將可能改善細菌基因組的研究。
由于細菌DNA通常取自人類皮膚,人類DNA可能作為其中的污染物出現(xiàn)。
譬如有證據(jù)表明,公共數(shù)據(jù)庫中大約5000個細菌基因組可能包含與人類Y序列相關(guān)的污染。
現(xiàn)在,利用完整的Y染色體序列,科學(xué)家就能夠識別出污染序列,然后將其去除,只留下細菌DNA進行研究。
這在之前,都可謂無從下手。
未來計劃雖然完整的人類Y染色體序列將為許多新發(fā)現(xiàn)打開大門,但接下來,作者還需要與人類泛基因組參考聯(lián)盟合作,將該序列整合到人類泛基因組中。
該基因組是基因組學(xué)的新參考,結(jié)合了來自不同祖先背景的多人的基因組信息,可以實現(xiàn)更為公平的研究和臨床發(fā)現(xiàn)。
當然,作者們的另一目標是希望與全世界科學(xué)家共享這一數(shù)據(jù)和研究,最終打造出一本Y染色體的遺傳差異目錄,擴大人類疾病的遺傳研究,并為基礎(chǔ)生物學(xué)提供新的見解。
論文地址:https://www.nature.com/articles/s41586-023-06457-y參考鏈接:https://news.ucsc.edu/2023/08/t2t-y-chromosome.html
— 完 —
量子位 QbitAI · 頭條號簽約
關(guān)注我們,第一時間獲知前沿科技動態(tài)
- 電子城燃氣灶維修(如何自行解決常見問題)10-05
-
兩米金箍棒展出引熱議 周大福門店:巡展非賣品
2024-08-27
-
長虹lt26720黑屏故障(長虹LT26720液晶電視黑屏故障的診斷與解決方案)
2024-08-27
-
憑錄取通知書咋買優(yōu)惠火車票?超詳細購票指南來了!
2024-08-27