• 快速組裝全基因組在個人電腦實現 比當前最先進方法快百倍并節約八成資源
    來源: ?科技日報 作者: 發布時間: 2021-09-17

    據《細胞系統》雜志9月14日發表的一項研究,美國麻省理工學院(MIT)和法國巴斯德研究所的科學家開發出一種在個人計算機上重建包括人類基因組在內的全基因組技術。這種技術比當前最先進的方法快大約一百倍,且僅使用目前五分之一的資源。這項研究以單詞而非字母為語言模型提供壓縮的構建模塊,從而可以更緊湊地表示基因組數據。

    “我們可以在一臺普通的筆記本電腦上快速組裝整個基因組和宏基因組,包括微生物基因組,”MIT計算機科學和人工智能實驗室教授波尼·博格說,“這種能力對于評估與疾病和細菌感染(例如敗血癥)相關的腸道微生物組變化至關重要,這讓我們能夠更快地治療并挽救生命。”

    自人類基因組計劃開展以來,基因組組裝項目取得了長足的進步,該計劃于2003年完成了首個完整的人類基因組組裝,耗資約27億美元,并進行了十多年的國際合作。雖然目前完成人類基因組組裝已不再需要耗費數年時間,但仍然需要幾天時間和強大的計算機能力。第三代測序技術雖可提供具有數萬個堿基對的、太字節數量級的高質量基因組序列,但事實上,將如此巨量數據的基因組進行組裝,仍具有挑戰性。

    為了超越當前技術從而更有效地進行基因組組裝,包括在所有可能的讀數對之間進行成對比較,博格及其同事此次將研究目標轉向了語言模型。他們基于“de Bruijn”圖(一種用于基因組組裝的簡單、高效的數據結構)概念,開發了一種極小空間“de Bruijn”圖,它使用被稱為“極小值”的短核苷酸序列,代替單個核苷酸。

    博格表示:“極小空間‘de Bruijn’圖只存儲總核苷酸的一小部分,同時保留了整個基因組結構,使它們比經典‘de Bruijn’圖更有效。”研究人員利用新方法為661406個細菌基因組的集合構建了一個索引,這是迄今為止同類集合中最大的一個。他們發現,這項新技術可在13分鐘內搜索整個集合中的抗菌素抗性基因,而使用標準序列比對這一過程需要7小時。

    總編輯圈點

    基因組組裝對于基因組分析的“前途”十分關鍵,這其實是一個把測序產生的讀取片段經過拼接再生成基因組堿基序列的過程。聽起來很繞,但基因組組裝確實是生物信息學領域的核心問題,因為當前測序技術獲得的序列一般都比較短,需要組裝拼接成較長的、完整的序列,才能用于進一步分析。這一直以來都是很繁冗的一個步驟,但現在本文中的成果,讓科學家們實現了在最省力的設備中、在最短的時間內,完成了更為精準的組裝。(記者張夢然


    地方動態

    首屆數字全民國防教育高峰論壇在京舉行

    第四屆信息技術及應用創新人才發展交流大會暨中國信息協會第三屆信息技術服務業應用技能大賽頒獎典禮在京隆重召開

    2023(第五屆)中國電子政務安全大會在京成功召開

    中國信息協會首次職業技能等級認定考試在黑龍江省舉行

    • 協會要聞
    • 通知公告
    初爱视频教程完整版免费观看高清