0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

洪亮團隊在生信期刊JCIM發(fā)布最新成果,蛋白質(zhì)工程邁入通用人工智能時代

科技數(shù)碼 ? 來源:科技數(shù)碼 ? 作者:科技數(shù)碼 ? 2024-04-19 17:42 ? 次閱讀

近日,天鶩科技創(chuàng)始人&首席科學家洪亮教授團隊,在生物信息學和人工智能研究領域的國際權(quán)威學術(shù)期刊JCIM(Journal of Chemical Information and Modeling)上發(fā)表最新研究成果:“基于微環(huán)境感知圖神經(jīng)網(wǎng)絡構(gòu)建指導蛋白質(zhì)定向進化的通用人工智能”(Protein Engineering with Lightweight Graph Denoising Neural Networks)。在此項研究中,該團隊設計了一種微環(huán)境感知圖神經(jīng)網(wǎng)絡ProtLGN。ProtLGN能夠從蛋白質(zhì)三維結(jié)構(gòu)中學習有益的氨基酸突變位點,建立自然選擇下的氨基酸序列分布,用于指導蛋白質(zhì)氨基酸位點設計,最終實現(xiàn)蛋白質(zhì)指定功能的提升。

根據(jù)研究介紹,在生物化學實驗的基礎上,課題組證實了ProtLGN是一項通用的人工智能方法,在極少甚至沒有實驗數(shù)據(jù)的情況下,成功地實現(xiàn)了針對特定蛋白質(zhì)性質(zhì)的定向進化,包括提高抗體的親和力和穩(wěn)定性、增強多種熒光蛋白的熒光強度,以及提升核酸內(nèi)切酶的DNA切割活性。這是全球首次也是唯一一次經(jīng)濕實驗驗證,我們可以通過建立通用人工智能,在極少實驗數(shù)據(jù)甚至無實驗數(shù)據(jù)下實現(xiàn)不同蛋白特定性質(zhì)的定向進化。

人工智能的進步正在改變生命科學領域的研究方法和思維范式,尤其是在生物醫(yī)藥領域,而蛋白質(zhì)設計作為該領域的關鍵技術(shù)之一,正受到人工智能技術(shù)的深刻影響。傳統(tǒng)的蛋白質(zhì)設計方法存在效率低下、成本高昂、時間耗費長等難以解決的問題,基于深度學習的預測和篩選在蛋白質(zhì)設計中被逐步應用并驗證。

但現(xiàn)有方法大多是基于多序列比對(MSA)或蛋白質(zhì)語言模型(PLM)對蛋白質(zhì)序列進行特征提取。前者高度依賴于同源序列的數(shù)量,但在實際應用中,并非所有蛋白質(zhì)序列都能進行深度的同源比對;后者需要大量訓練數(shù)據(jù)和復雜的模型設計,導致訓練成本很高。即使是使用當前主流的自然語言預訓練模型的思路,考慮到每個蛋白質(zhì)都有獨特的性質(zhì)和進化方向,使用通用預訓練模型處理獨特蛋白質(zhì)時,不經(jīng)重新訓練直接應用也會帶來泛化性和表達能力的挑戰(zhàn)。

洪亮團隊設計的能夠提取氨基酸周圍微觀環(huán)境信息的等變圖神經(jīng)網(wǎng)絡的預訓練框架ProtLGN,結(jié)合蛋白質(zhì)的結(jié)構(gòu)信息對蛋白質(zhì)上的每個氨基酸進行同步編碼,學習蛋白質(zhì)三維結(jié)構(gòu)中有益的氨基酸突變位點和突變類型,用于指導具有不同功能的蛋白質(zhì)單位點突變和多位點突變設計。

wKgaomYiPHmAOgknAAhCEfZomC4516.png

圖1 ProtLGN框架示意圖

LGN的零樣本學習訓練框架如上圖所示。首先,輸入蛋白質(zhì)數(shù)據(jù)集中的每個序列被k臨近鄰居算法轉(zhuǎn)換成一個蛋白質(zhì)圖,并基于氨基酸性質(zhì)提取出節(jié)點特征、邊特征、以及氨基酸的三維坐標信息。接著,對一部分的節(jié)點特征進行噪聲擾動后輸入到等變圖神經(jīng)網(wǎng)絡中學習圖上的節(jié)點表示。這一節(jié)點表示被全連接層解碼后可以預測多個不同的目標,比如去噪的節(jié)點氨基酸類型標簽SASA和B-factor數(shù)值等。這里的預測誤差用于構(gòu)建損失函數(shù)并傳導回網(wǎng)絡層進行反向傳導。在預測階段,模型輸出突變蛋白質(zhì)的氨基酸概率,與野生型比對后,通過處理和計算得出突變體的評分。

為了驗證ProtLGN對蛋白質(zhì)突變體活性的預測效果,作者在不同蛋白質(zhì)的多種生理功能性質(zhì)上進行了充分驗證,確保ProtLGN預測效果的通用性,包括VHH抗體、熒光蛋白(綠色、藍色、橙色)、核酸內(nèi)切酶(KmAgo)等多種蛋白的熱穩(wěn)定性、結(jié)合能力、熒光強度、單鏈DNA剪切活性等蛋白質(zhì)工程常規(guī)關注和改造的多種關鍵功能指標。

wKgaomYiPHmAYrHLAALDwicoGMM096.png

圖2 熒光蛋白發(fā)光強度(FP),VHH抗體結(jié)合強度與熱穩(wěn)定性,以及中溫核酸剪切酶(KmAgo)剪切活性的多點位突變結(jié)果

濕實驗結(jié)果表明,ProtLGN可以在沒有濕實驗數(shù)據(jù)或僅少量類似功能蛋白質(zhì)的實驗數(shù)據(jù)基礎上達到40%的單點位改造成功率,并且在部分單位點上實現(xiàn)了多種功能協(xié)同提升。

上述結(jié)果表明ProtLGN能夠極大改善傳統(tǒng)蛋白質(zhì)工程方法中成本高、成功率低、數(shù)據(jù)稀缺等問題。更為重要的是,本文首次使用深度學習模型在學習單位點突變體活性數(shù)據(jù)后,準確預測組合位點的活性,并且在單輪濕實驗中即可篩選出功能顯著優(yōu)于低位點突變體的高位點突變體,表明ProtLGN能夠有效挖掘蛋白質(zhì)定向進化中的正上位效應,為蛋白質(zhì)的深度進化提供一條有效途徑。

ProtLGN作為一種新型的蛋白質(zhì)設計方法,為生物學家和藥物研發(fā)人員提供了一個強大且可靠的計算工具。ProtLGN不僅能夠深入解析蛋白質(zhì)的結(jié)構(gòu)與功能的復雜關系,而且能夠突破傳統(tǒng)蛋白質(zhì)設計方法遇到的瓶頸,為基于蛋白質(zhì)的醫(yī)藥研究、生物技術(shù)開發(fā)等提供了全新并且有效的解決方案。

自然科學研究院/上海國家應用數(shù)學中心(上海交通大學分中心)助理研究員周冰心博士,密歇根大學神經(jīng)科學研究所/細胞與發(fā)育生物學研究所博士后鄭力榮博士,生命科學技術(shù)學院博士研究生吳邦昊,上海人工智能實驗室/華東理工大學信息科學與工程學院碩士研究生譚揚為共同第一作者。自然科學研究院/物理與天文學院/張江高等研究院洪亮教授為通訊作者。

該工作得到了國家自然科學基金委、上海市科委、教委、上海人工智能國家實驗室和張江高等研究院的支持。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1789

    文章

    46302

    瀏覽量

    236464
  • PLM
    PLM
    +關注

    關注

    2

    文章

    97

    瀏覽量

    20806
收藏 人收藏

    評論

    相關推薦

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    研究的進程。從蛋白質(zhì)結(jié)構(gòu)預測到基因測序與編輯,再到藥物研發(fā),人工智能技術(shù)在生命科學的各個層面都發(fā)揮著重要作用。特別是像AlphaFold這樣的工具,成功解決了困擾生物學界半個多世紀的蛋白質(zhì)
    發(fā)表于 10-14 09:21

    差示掃描量熱儀測試蛋白質(zhì)的應用案例

    過程中可能出現(xiàn)的吸熱或放熱峰,這些峰對應于角蛋白分子鏈的運動、微纖維的熔融、或蛋白質(zhì)的變性等現(xiàn)象。 ? ?通過對比受延展和熱處理前后的DSC曲線,研究人員可以了解這些處理對角蛋白復合物的熱性質(zhì)和結(jié)構(gòu)穩(wěn)定性的影響。例如,熱處理可能
    的頭像 發(fā)表于 10-09 15:45 ?72次閱讀
    差示掃描量熱儀測試<b class='flag-5'>蛋白質(zhì)</b>的應用案例

    創(chuàng)客中國AIGC專題賽冠軍天鶩科技:AI蛋白質(zhì)設計引領者

    源自自然的蛋白質(zhì)與現(xiàn)代科技的創(chuàng)新精神相結(jié)合,打造蛋白質(zhì)設計與應用的新范式。”在江西南昌舉辦的第九屆“創(chuàng)客中國”生成式人工智能(AIGC)中小企業(yè)創(chuàng)新創(chuàng)業(yè)大賽中,上海天鶩科技有限公司(下稱“天鶩科技”)分享了這一理念。 天鶩科技是
    的頭像 發(fā)表于 09-18 12:04 ?160次閱讀
    創(chuàng)客中國AIGC專題賽冠軍天鶩科技:AI<b class='flag-5'>蛋白質(zhì)</b>設計引領者

    EvolutionaryScale推出基于NVIDIA GPU模型的新型蛋白質(zhì)研究方案

    EvolutionaryScale 于 6 月 25 日發(fā)布了第三代 ESM 模型 ESM3,該模型可同時對蛋白質(zhì)的序列、結(jié)構(gòu)和功能進行推理,為蛋白質(zhì)研發(fā)工程師提供了一個可編程的平臺。
    的頭像 發(fā)表于 08-23 16:45 ?563次閱讀

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產(chǎn)品
    發(fā)表于 08-22 15:00

    阿丘科技成功入選“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”,AI+工業(yè)視覺實力再獲肯定

    近日,“2024全球數(shù)字經(jīng)濟大會人工智能專題論壇”在北京召開,論壇發(fā)布“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃(第三批)”名單。阿丘科技憑借其多年在人工智能+機器視覺領域的技術(shù)積累和落地案
    的頭像 發(fā)表于 07-16 08:25 ?371次閱讀
    阿丘科技成功入選“北京市<b class='flag-5'>通用人工智能</b>產(chǎn)業(yè)創(chuàng)新伙伴計劃”,AI+工業(yè)視覺實力再獲肯定

    千方科技成功入選“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”

    日前,“2024全球數(shù)字經(jīng)濟大會人工智能專題論壇”在京舉辦,會上正式發(fā)布了新一批“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”成員名單(以下簡稱“伙伴計劃”)。千方科技憑借在交通、物聯(lián)、城市治理等關鍵場景中
    的頭像 發(fā)表于 07-09 09:26 ?481次閱讀
    千方科技成功入選“北京市<b class='flag-5'>通用人工智能</b>產(chǎn)業(yè)創(chuàng)新伙伴計劃”

    大模型應用之路:從提示詞到通用人工智能(AGI)

    大模型在人工智能領域的應用正迅速擴展,從最初的提示詞(Prompt)工程到追求通用人工智能(AGI)的宏偉目標,這一旅程充滿了挑戰(zhàn)與創(chuàng)新。本文將探索大模型在實際應用中的進展,以及它們?nèi)绾螢閷崿F(xiàn)AGI
    的頭像 發(fā)表于 06-14 10:20 ?2000次閱讀
    大模型應用之路:從提示詞到<b class='flag-5'>通用人工智能</b>(AGI)

    利用微流控探針誘導的化學質(zhì)膜穿孔,實現(xiàn)單細胞胞內(nèi)蛋白質(zhì)遞送

    將小分子、核酸、蛋白質(zhì)和藥物導入細胞是監(jiān)測和了解細胞行為以及生物功能的重要途徑。
    的頭像 發(fā)表于 05-28 10:11 ?418次閱讀
    利用微流控探針誘導的化學質(zhì)膜穿孔,實現(xiàn)單細胞胞內(nèi)<b class='flag-5'>蛋白質(zhì)</b>遞送

    天府錦城實驗室在生物傳感與蛋白質(zhì)測序領域取得重要進展

    3月10日,記者從天府錦城實驗室(未來醫(yī)學城)獲悉,四川大學華西醫(yī)院臨床檢驗醫(yī)學研究中心與生物治療全國重點實驗室、天府錦城實驗室(未來醫(yī)學城)耿佳教授和華西第二醫(yī)院陳路教授聯(lián)合團隊在生物傳感與蛋白質(zhì)測序領域取得重要進展。
    的頭像 發(fā)表于 03-17 09:10 ?838次閱讀
    天府錦城實驗室<b class='flag-5'>在生</b>物傳感與<b class='flag-5'>蛋白質(zhì)</b>測序領域取得重要進展

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能
    發(fā)表于 02-26 10:17

    對新輔助TCHP治療響應的HER2+乳腺癌空間蛋白質(zhì)組特征

    GeoMx IPA可以實現(xiàn)對組織中任何區(qū)域(如腫瘤區(qū)域、免疫交界區(qū)域、腫瘤微環(huán)境和正常基質(zhì)區(qū)域等)中的570多種蛋白質(zhì)進行空間原位的表達檢測,快速發(fā)現(xiàn)新的蛋白質(zhì)生物標記物和藥物靶點。
    的頭像 發(fā)表于 12-26 16:52 ?780次閱讀
    對新輔助TCHP治療響應的HER2+乳腺癌空間<b class='flag-5'>蛋白質(zhì)</b>組特征

    燧原科技發(fā)布“燎原”生態(tài)合作計劃,共建通用人工智能產(chǎn)業(yè)化聯(lián)盟

    12月20日,在全國一體化算力網(wǎng)絡國家樞紐節(jié)點(甘肅)慶陽數(shù)據(jù)中心集群綠色普惠算力行動推進大會上, 燧原科技正式發(fā)布了“燎原”生態(tài)合作計劃,攜手產(chǎn)業(yè)上下游合作伙伴共建通用人工智能產(chǎn)業(yè)化聯(lián)盟。 以
    的頭像 發(fā)表于 12-21 19:55 ?1824次閱讀
    燧原科技<b class='flag-5'>發(fā)布</b>“燎原”生態(tài)合作計劃,共建<b class='flag-5'>通用人工智能</b>產(chǎn)業(yè)化聯(lián)盟

    人工智能驅(qū)動蛋白質(zhì)設計取得重大突破,人類健康和環(huán)境監(jiān)測有望受益

     據(jù)華盛頓大學化學與生物工程系的David Baker教授透露,其領導的研究小組整合了深度學習算法和序列設計工具ProteinMPNN,從而實現(xiàn)了高效的蛋白質(zhì)功能性設計。
    的頭像 發(fā)表于 12-20 14:32 ?645次閱讀

    DeepMind最新推出新一代蛋白質(zhì)結(jié)構(gòu)預測工具,已用于藥物設計

    據(jù)悉,最新的 AlphaFold 系統(tǒng)由DeepMind及其衍生公司 Isomorphic Labs (專注于利用 AI 做藥物發(fā)現(xiàn))共同開發(fā),不再局限于蛋白質(zhì)折疊,還能夠在配體、蛋白質(zhì)、核酸以及
    的頭像 發(fā)表于 11-03 15:39 ?745次閱讀