• 人工智能新模型可解碼DNA隱藏“語言”
    來源: 科技日報 作者: 發布時間: 2024-08-07

    科技日報北京8月6日電 (記者張佳欣)DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上下文來提取DNA序列的功能信息。這一新工具有望徹底改變基因組學并加速個性化醫療的發展。相關研究論文發表在新一期《自然·機器智能》雜志上。

    大型語言模型通過文本訓練,發展出了在多種語境下使用語言的能力。研究人員設想將生命代碼DNA當作一種語言,訓練了一個大型語言模型——GROVER。

    在語言方面,人們談論的是語法、句法和語義。而對于DNA來說,這意味著學習核苷酸的序列等。就像GPT模型學習人類語言一樣,GROVER基本上學會了DNA“語言”。

    研究表明,GROVER不僅能準確地預測接下來的DNA序列,還可用來提取具有生物學意義的上下文信息,例如識別DNA上的基因啟動子或蛋白質結合位點。此外,GROVER還學習了“表觀遺傳”過程,即在DNA序列不發生改變的情況下,基因表達的可遺傳變化。

    GROVER有望解鎖DNA中蘊含著關于人類本質、疾病易感性以及對治療反應的關鍵信息。研究人員相信,通過語言模型理解DNA的規則,將有助于揭示隱藏在DNA中的生物意義,從而推動基因組學和個性化醫學發展。


    地方動態

    擔當作為新起點 改革攻堅新征程|中國信息協會第七屆理事會第二次會議暨第七屆會員代表大會第二次會議在京隆重召開

    中國信息協會第五屆信息技術服務業應用技能大賽新聞發布會在京召開

    中國信息協會會長王金平赴中國科學院計算機網絡信息中心調研交流

    致協會全體會員的感謝信

    • 協會要聞
    • 通知公告
    初爱视频教程完整版免费观看高清