IBM 研究部主任達(dá)里奧吉爾表示,科學(xué)的緊迫性從未如此強(qiáng)烈。Gil 指的是為 Covid-19 開(kāi)發(fā)疫苗的競(jìng)賽,但他說(shuō),這種緊迫性并沒(méi)有消失,他引用了氣候變化、未來(lái)流行病、糧食短缺和能源安全等規(guī)模問(wèn)題。解決這些問(wèn)題所需要的是加快發(fā)現(xiàn)速度。
該解決方案將結(jié)合人工智能 (AI)、量子計(jì)算、高性能計(jì)算 (HPC) 和混合云技術(shù)。
達(dá)里奧吉爾(圖片:IBM)
“使用[這些技術(shù)],我們可以從根本上改變我們進(jìn)行發(fā)現(xiàn)的過(guò)程,”吉爾說(shuō)?!拔覀兛梢约铀俸驮鰪?qiáng)傳統(tǒng)的科學(xué)方法。”
Gil 的例子是材料科學(xué),它在歷史上一直依賴于偶然發(fā)現(xiàn)(想想鐵氟龍,它是在尋找新制冷劑時(shí)發(fā)現(xiàn)的。凡士林和石墨烯是類似的驚喜)。如果不是偶然發(fā)現(xiàn)的,有用的新材料通常是通過(guò)反復(fù)試驗(yàn)發(fā)現(xiàn)的,即使使用最新的基于 HPC 的復(fù)雜分子建模和模擬,這也非常昂貴并且可能需要數(shù)年時(shí)間。
這就是人工智能的用武之地。
“[AI] 真正實(shí)現(xiàn)了前所未有的大規(guī)模速度和自動(dòng)化水平,幫助我們解決越來(lái)越復(fù)雜的問(wèn)題,”Gil 說(shuō)?!罢侨斯ぶ悄芸梢詭椭覀冇瓉?lái)這個(gè)加速發(fā)現(xiàn)的新時(shí)代。它可以幫助我們?cè)鰪?qiáng)科學(xué)方法,將其從線性過(guò)程轉(zhuǎn)變?yōu)殚]環(huán)?!?/p>
閉環(huán) Gil 設(shè)想使用 AI 篩選現(xiàn)有知識(shí)庫(kù),然后使用 HPC(或未來(lái)的量子計(jì)算)通過(guò)模擬增強(qiáng)數(shù)據(jù)并尋找該知識(shí)庫(kù)中的空白。這些信息被輸入到生成 AI 模型中,該模型可以建議候選新分子來(lái)填補(bǔ)空白。然后,人工智能驅(qū)動(dòng)的機(jī)器人可以根據(jù)數(shù)據(jù)和過(guò)去化學(xué)反應(yīng)的例子生成候選分子。
Gil 說(shuō):“這個(gè)過(guò)程將隨著新知識(shí)引發(fā)新問(wèn)題而達(dá)到高潮,循環(huán)再次開(kāi)始?!?“所以這將是一個(gè)持續(xù)的發(fā)現(xiàn)循環(huán),越來(lái)越自動(dòng)化和越來(lái)越自主。”
Gil 將這個(gè)循環(huán)稱為“加速發(fā)現(xiàn)”,并強(qiáng)調(diào)這不是在遙遠(yuǎn)的未來(lái),而是現(xiàn)在肯定會(huì)發(fā)生的事情。
PAG 發(fā)現(xiàn)
Gil 演講中的另一個(gè)例子是基于加速發(fā)現(xiàn)更可持續(xù)的光刻膠材料。光刻膠對(duì)半導(dǎo)體制造過(guò)程至關(guān)重要;化學(xué)放大光刻膠使用稱為光酸產(chǎn)生劑 (PAG) 的化學(xué)物質(zhì)。
使用傳統(tǒng)工藝,發(fā)現(xiàn)一個(gè)新的 PAG 可能需要 10 年時(shí)間,并且至少要花費(fèi) 1000 萬(wàn)美元。科學(xué)家們將搜索已發(fā)表的文獻(xiàn),并利用他們能找到的東西以及他們自己的知識(shí)來(lái)設(shè)計(jì)一種分子并針對(duì)所需的特性。然后,他們將經(jīng)歷合成、表征和測(cè)試的迭代循環(huán),直到獲得令人滿意的化合物。即使有超級(jí)計(jì)算機(jī)可供使用,這個(gè)過(guò)程也是漫長(zhǎng)而艱難的,尤其是因?yàn)橐紤]大量的化合物。
加速發(fā)現(xiàn)已將該過(guò)程縮短到一年多 100 萬(wàn)美元。
加速發(fā)現(xiàn)工作流程有四個(gè)階段。首先,一個(gè)名為 Deep Search 的人工智能會(huì)“讀取”所有現(xiàn)有的關(guān)于 PAG 的科學(xué)文獻(xiàn)。
“使用深度搜索通常會(huì)將該過(guò)程加快一千倍,因?yàn)?AI 可以在每個(gè)處理核心每秒攝取和處理大約 20 頁(yè),”Gil 說(shuō)?!傲硪环矫妫夹g(shù)文獻(xiàn)的人類讀者通常每頁(yè)需要一到兩分鐘。”
該知識(shí)庫(kù)由已知 PAG 系列的樹(shù)狀圖表示(下圖的內(nèi)部灰色部分)。樹(shù)狀圖中的空白區(qū)域代表數(shù)據(jù)丟失的地方。
第二步是通過(guò) AI 驅(qū)動(dòng)的模擬來(lái)豐富數(shù)據(jù)。另一個(gè) AI 模擬已知 PAG 的實(shí)驗(yàn)參數(shù),比常規(guī)模擬快 2-40 倍。
“對(duì)于某些房產(chǎn),可用數(shù)據(jù)非常稀疏或嘈雜且不可靠,幾乎沒(méi)有用,”吉爾說(shuō)?!拔覀儽仨氂米銐虻念A(yù)測(cè)屬性數(shù)據(jù)來(lái)擴(kuò)充這個(gè)數(shù)據(jù)集,以訓(xùn)練人工智能模型。在這里,我們使用 AI 豐富的模擬來(lái)為數(shù)據(jù)集中 PAG 的重要屬性提供定量值?!?/p>
這些特性包括毒性(上表中的紫色數(shù)據(jù))、生物降解性(藍(lán)色)和 λ max,即材料吸收最強(qiáng)的光波長(zhǎng)(綠色)。
這些信息被輸入第三種類型的人工智能,稱為生成模型。如今,生成式 AI 被用于為社交媒體檔案、與人類書(shū)寫(xiě)的散文、計(jì)算機(jī)代碼和現(xiàn)在的分子無(wú)法區(qū)分的長(zhǎng)論文文本生成虛假的檔案圖像。這個(gè)想法是有效地填補(bǔ)(灰色)樹(shù)狀圖中的空白。在 IBM 的案例中,他們希望尋找一種具有更好可持續(xù)性特性(尤其是生物降解性)的 PAG 材料。
“我們已經(jīng)看到使用生成模型來(lái)識(shí)別差距并為測(cè)試創(chuàng)建材料概念的 10 倍加速,”Gil 說(shuō)。
該過(guò)程的最后一步是在 AI 驅(qū)動(dòng)的實(shí)驗(yàn)室中測(cè)試結(jié)果,根據(jù) Gil 的說(shuō)法,該實(shí)驗(yàn)室的合成速度比傳統(tǒng)方法快一百倍。
在這個(gè)階段有一些人為的參與;專家選擇最佳候選者進(jìn)行實(shí)驗(yàn)驗(yàn)證,盡管產(chǎn)生現(xiàn)實(shí)生活中化學(xué)物質(zhì)的化學(xué)合成是由機(jī)器完成的。在位于蘇黎世的 IBM RoboRXN 實(shí)驗(yàn)室,人工智能、自動(dòng)化和云技術(shù)的驚人組合已經(jīng)學(xué)習(xí)了合成有機(jī)化學(xué),并且可以通過(guò)機(jī)器人遠(yuǎn)程應(yīng)用它。
IBM 在 11 月使用這種加速發(fā)現(xiàn)過(guò)程發(fā)現(xiàn)了其第一個(gè)新的 PAG 材料。
“[新材料] 帶來(lái)了一個(gè)未來(lái)會(huì)有更多、更多加速發(fā)現(xiàn)的世界的希望,”吉爾說(shuō)。
未來(lái)愿景
除了解決流行病和氣候變化等人類問(wèn)題外,IBM 的愿景是加速發(fā)現(xiàn)將定義未來(lái)最具創(chuàng)新性的業(yè)務(wù)。以科學(xué)發(fā)現(xiàn)為核心業(yè)務(wù)的公司顯然會(huì)受益,包括生命科學(xué)、化學(xué)品和材料公司。當(dāng)今大企業(yè)的另一大部分依賴于科學(xué)發(fā)現(xiàn),包括汽車制造商、科技公司、醫(yī)療保健和公用事業(yè)。還有更多是由信息和發(fā)現(xiàn)驅(qū)動(dòng)的,也就是說(shuō),他們通過(guò)數(shù)據(jù)實(shí)驗(yàn)和學(xué)習(xí)獲得了競(jìng)爭(zhēng)優(yōu)勢(shì)。第三類是軟件、金融市場(chǎng)、媒體和娛樂(lè)、電信公司、銀行和零售)。加速科學(xué)和發(fā)現(xiàn)將影響所有這些業(yè)務(wù)。
三種類型的科學(xué)驅(qū)動(dòng)型企業(yè)(圖片:IBM)
“我確信明天最具創(chuàng)新性的企業(yè)將是發(fā)現(xiàn)驅(qū)動(dòng)型企業(yè),”吉爾說(shuō)?!八麄儗で笃脚_(tái)、工具和技術(shù),使他們能夠加速發(fā)現(xiàn)過(guò)程,從而賦予他們競(jìng)爭(zhēng)優(yōu)勢(shì)。但這需要對(duì)科學(xué)和研發(fā)進(jìn)行大量投資?!?/p>
吉爾再次提到了在 14 個(gè)月內(nèi)開(kāi)發(fā)的 Covid-19 疫苗。如果發(fā)現(xiàn)按照傳統(tǒng)方式進(jìn)行,疫苗要到 2033 年才能上市。
“為了應(yīng)對(duì)我們最大的挑戰(zhàn),我們需要更快地發(fā)現(xiàn),”他說(shuō)?!拔覀冃枰尫偶铀侔l(fā)現(xiàn)的力量,我們需要有目的地去做,不僅僅是數(shù)字產(chǎn)品和服務(wù)的數(shù)字創(chuàng)新,還要引導(dǎo)我們的數(shù)字能力來(lái)改善我們的物理世界?!?/p>
審核編輯 黃昊宇
-
AI
+關(guān)注
關(guān)注
87文章
29419瀏覽量
267719 -
先進(jìn)技術(shù)
+關(guān)注
關(guān)注
0文章
24瀏覽量
6207
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論