由 NVIDIA 等企業(yè)賦能的一家初創(chuàng)公司推出了基于 NVIDIA GPU 模型的新型蛋白質(zhì)研究方案。
基于提示的代碼生成技術(shù)讓生成式 AI 徹底革新了軟件開發(fā)領(lǐng)域,接下來蛋白質(zhì)設(shè)計(jì)領(lǐng)域也將迎來變革。
EvolutionaryScale 于 6 月 25 日發(fā)布了第三代 ESM 模型 ESM3,該模型可同時對蛋白質(zhì)的序列、結(jié)構(gòu)和功能進(jìn)行推理,為蛋白質(zhì)研發(fā)工程師提供了一個可編程的平臺。
這家初創(chuàng)公司源自 Meta 公司的基礎(chǔ) AI 研究(FAIR)部門,最近獲得了由 Lux Capital、Nat Friedman 和 Daniel Gross 領(lǐng)投以及 NVIDIA 和亞馬遜參投的融資。
EvolutionaryScale 處于可編程生物學(xué)的最前沿,可以幫助研究人員設(shè)計(jì)蛋白質(zhì),從而幫助找到癌細(xì)胞的靶點(diǎn)、尋找有害塑料的替代品、推動環(huán)境保護(hù)等等。
通過 ESM3 模型的規(guī)模化開發(fā),EvolutionaryScale 開拓了可編程生物學(xué)的前沿,讓 ESM3 成為有史以來算力最高的生物基礎(chǔ)模型。980 億參數(shù)的 ESM3 模型比其前身 ESM2 多使用了大約 25 倍的浮點(diǎn)運(yùn)算和 60 倍的數(shù)據(jù)。
EvolutionaryScale 整理了一個包含 20 多億個蛋白質(zhì)序列的數(shù)據(jù)庫用于訓(xùn)練 AI 模型,它提供的技術(shù)可以為藥物開發(fā)、疾病根除以及藥物研發(fā)人員服務(wù)。
通過 ESM3 加速計(jì)算機(jī)生物學(xué)研究
借助大量訓(xùn)練數(shù)據(jù),EvolutionaryScale 希望通過 ESM3 加速蛋白質(zhì)研發(fā)。
該模型采用了從生物體和生物群落中采樣的近 28 億個蛋白質(zhì)序列進(jìn)行訓(xùn)練,使科學(xué)家能夠提示該模型識別和驗(yàn)證新的蛋白質(zhì),并不斷提升精度。
與之前的版本相比,ESM3 帶來了重大更新。這是一個原生的生成式模型,也是一個 “all to all” 模型,意味著結(jié)構(gòu)和功能注解可以作為輸入信息,而不僅僅是輸出信息。
該模型公開上線后,科學(xué)家們就可以對其進(jìn)行微調(diào),基于自己的專有數(shù)據(jù)構(gòu)建專用模型。ESM3 通過大量數(shù)據(jù)進(jìn)行大規(guī)模生成式訓(xùn)練,加強(qiáng)了蛋白質(zhì)設(shè)計(jì)能力,為計(jì)算機(jī)生物研究提供了一臺時光機(jī)。
通過 NVIDIA BioNeMo
推動下一個重大突破
ESM3 為生物學(xué)家和蛋白質(zhì)設(shè)計(jì)師提供了增強(qiáng)的生成式 AI,幫助他們更好地設(shè)計(jì)和理解蛋白質(zhì)。通過簡單的提示,它可以根據(jù)提供的蛋白質(zhì)骨架生成新的蛋白質(zhì),根據(jù)反饋?zhàn)晕腋倪M(jìn)蛋白質(zhì)設(shè)計(jì),以及根據(jù)用戶指定的功能設(shè)計(jì)蛋白質(zhì)。這些功能能夠以任意組合串聯(lián)使用,以提供思維鏈蛋白質(zhì)設(shè)計(jì),就好像用戶在給一位“研究人員”發(fā)信息一樣,而這位“研究人員”已經(jīng)記住了人類已知的每一個蛋白質(zhì)序列的復(fù)雜三維含義,并且已經(jīng)流利地掌握了這種語言,使用戶能夠來回迭代。
EvolutionaryScale 聯(lián)合創(chuàng)始人兼工程副總裁 Tom Sercu 表示:“在我們的內(nèi)部測試中,ESM3 能夠創(chuàng)造性地響應(yīng)各種復(fù)雜提示,這給我們留下了深刻的印象。它曾解決了一個極其困難的蛋白質(zhì)設(shè)計(jì)問題,創(chuàng)造出一種新型的綠色熒光蛋白。我們希望 ESM3 幫助科學(xué)家加快工作進(jìn)展,開辟新的可能性——期待著看到它為未來的生命科學(xué)研究做出重要貢獻(xiàn)?!?/p>
EvolutionaryScale 已于 6 月 25 日開放 API 接口進(jìn)行封閉測試,提供小型 ESM3 開放版本的代碼和權(quán)重,供非商業(yè)用途使用。這個版本即將在NVIDIA BioNeMo上發(fā)布,后者是一個用于藥物發(fā)現(xiàn)的生成式 AI 平臺。完整的 ESM3 系列模型將很快以NVIDIA NIM微服務(wù)的形式提供給指定客戶,該服務(wù)在與 NVIDIA 合作下進(jìn)行了運(yùn)行時優(yōu)化,并由 NVIDIA AI Enterprise 軟件許可證支持,可在 ai.nvidia.com 上進(jìn)行測試。
訓(xùn)練這些模型所需的算力呈指數(shù)級增長。ESM3 使用 Andromeda 集群進(jìn)行訓(xùn)練,該集群配備了NVIDIA Quantum-2 InfiniBand網(wǎng)絡(luò)。
ESM3 模型將在指定合作伙伴的平臺上提供,包括 Amazon Bedrock、Amazon Sagemaker、AWS HealthOMICs 和 NVIDIA BioNeMo。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4814瀏覽量
102629 -
gpu
+關(guān)注
關(guān)注
27文章
4629瀏覽量
128439 -
AI
+關(guān)注
關(guān)注
87文章
29350瀏覽量
267631 -
模型
+關(guān)注
關(guān)注
1文章
3054瀏覽量
48569
原文標(biāo)題:NVIDIA 為用于蛋白質(zhì)設(shè)計(jì)的生成式 AI 模型 ESM3 提供支持
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論