0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟谷歌AI模型在SuperGLUE測試中超過人類

我快閉嘴 ? 來源:澎湃新聞 ? 作者:澎湃新聞 ? 2021-01-08 10:53 ? 次閱讀

近日,科技公司谷歌和微軟相繼在一份權(quán)威自然語言理解榜單中超越人類的表現(xiàn),微軟宣稱這“標(biāo)志著邁向通用人工智能的重要里程碑。”

自然語言理解(Natural Language Understanding,簡稱NLU)任務(wù)在人工智能領(lǐng)域歷史悠久,被譽(yù)為“人工智能皇冠上的明珠”。由于自然語言本身存在的歧義性或多義性,實(shí)現(xiàn)高質(zhì)量的自然語言理解有相當(dāng)?shù)碾y度。

為了衡量人工智能模型的自然語言理解能力,紐約大學(xué)、華盛頓大學(xué)、Facebook和DeepMind在2019年合作提出一個(gè)名為SuperGLUE的人工智能基準(zhǔn)測試。SuperGLUE由2018年GLUE演化而來,其語言理解任務(wù)難度更大,包括問答、自然語言推理、指代消解和詞義消歧等等。

在最近更新的SuperGLUE上,微軟的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人類基準(zhǔn)線(human baseline)。這是人工智能首次在SuperGLUE中表現(xiàn)超越人類。

盡管在SuperGLUE測試上取得令人滿意的結(jié)果,但微軟坦言,DeBERTa模型還沒有達(dá)到人類智能的自然語言理解水平。人類非常善于利用從不同任務(wù)中學(xué)到的知識來解決新的任務(wù),這是AI模型需要學(xué)習(xí)的地方。

排名第一的微軟模型DeBERTa共有15億個(gè)參數(shù)。在SuperGLUE測試中,單個(gè)DeBERTa模型的宏觀平均分(89.9分)超過了人類的表現(xiàn)(89.8分);模型整體得分(90.3分)也超過人類基準(zhǔn)線(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,同樣超過人類基準(zhǔn)線(89.8分)。

在SuperGLUE測試中,人工智能模型被要求回答類似這樣的問題:

已知“這個(gè)孩子對疾病產(chǎn)生了免疫力”,問“這是由什么導(dǎo)致的?”請選擇:A.“他避免接觸這種疾病”;或B.“他接種了這一疾病的疫苗”。

這是一個(gè)簡單的因果推理任務(wù),人類很容易選出正確答案。但對人工智能模型而言,卻是不小的挑戰(zhàn)。為了得出正確答案,模型需要理解已知條件和選項(xiàng)之間的因果關(guān)系。

2021年1月6日,微軟在博客發(fā)文詳細(xì)介紹此次取得榜首的DeBERTa模型。

DeBERTa全稱Decoding-enhanced-BERT-with-disentangled attention,是一個(gè)基于Transformer架構(gòu)的神經(jīng)語言模型,采用自監(jiān)督學(xué)習(xí)方法對大量原始文本語料庫進(jìn)行預(yù)訓(xùn)練。DeBERTa的目標(biāo)是學(xué)習(xí)通用的語言表達(dá)形式,適用于各種自然語言理解任務(wù)。DeBERTa主要用到三種新技術(shù),分別是分離注意力機(jī)制、增強(qiáng)的掩碼解碼器和用于微調(diào)的虛擬對抗訓(xùn)練方法。

排名第二的T5+Meena技術(shù)來自谷歌。谷歌團(tuán)隊(duì)尚未詳細(xì)解釋其模型在SuperGLUE創(chuàng)紀(jì)錄的原因。但微軟在博客文章中評價(jià)稱,谷歌的T5模型由110億個(gè)參數(shù)組成,相比之下,15億參數(shù)的DeBERTa在訓(xùn)練和維護(hù)上更加節(jié)能,更容易壓縮并部署到各種程序中。

微軟正在將DeBERTa模型集成到下一代“圖靈自然語言生成模型”(Turing NLRv4)中。下一步,他們準(zhǔn)備向公眾公開15億參數(shù)的DeBERTa模型及其源代碼。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6537

    瀏覽量

    103808
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46328

    瀏覽量

    236496
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    279

    瀏覽量

    13309
收藏 人收藏

    評論

    相關(guān)推薦

    AI模型MCU的應(yīng)用

    機(jī)遇。將AI模型集成到MCU,不僅提升了設(shè)備的智能化水平,還使得設(shè)備能夠執(zhí)行更復(fù)雜的任務(wù),實(shí)現(xiàn)自主決策和實(shí)時(shí)響應(yīng)。本文將從AI模型
    的頭像 發(fā)表于 07-12 10:24 ?682次閱讀

    微軟、谷歌等科技巨頭承諾安全開發(fā)AI模型

    近日,微軟谷歌、OpenAI等16家科技巨頭“人工智能(AI)首爾峰會”上達(dá)成共識,承諾AI
    的頭像 發(fā)表于 05-22 11:25 ?452次閱讀

    微軟將推出自研AI模型

    微軟正在緊鑼密鼓地訓(xùn)練一款全新的自研人工智能大模型——“MAI-1”。據(jù)悉,這款模型規(guī)模龐大,足以與谷歌的Gemini和OpenAI的ChatGPT相媲美。
    的頭像 發(fā)表于 05-13 11:30 ?608次閱讀

    新火種AI|正面硬剛OpenAI與谷歌?微軟竟然偷偷自研出5000億參數(shù)大模型!

    AI領(lǐng)域,微軟公司一直以其獨(dú)到的創(chuàng)新性和前瞻性而聞名。也正因此,它搶先在AI賽道嗅到商機(jī),并極具預(yù)判性的投資了OpenAI,使其成為自己
    的頭像 發(fā)表于 05-11 11:47 ?499次閱讀
    新火種<b class='flag-5'>AI</b>|正面硬剛OpenAI與<b class='flag-5'>谷歌</b>?<b class='flag-5'>微軟</b>竟然偷偷自研出5000億參數(shù)大<b class='flag-5'>模型</b>!

    微軟準(zhǔn)備推出新的AI模型谷歌及OpenAI競爭

    據(jù)報(bào)道,微軟向OpenAI投資超過100億美元后,首次成功訓(xùn)練了一個(gè)名為“MAI-1”的內(nèi)部人工智能模型。這一模型規(guī)模龐大,足以與
    的頭像 發(fā)表于 05-08 10:45 ?486次閱讀

    微軟準(zhǔn)備推出全新人工智能語言模型

    微軟近期傳出消息,正在秘密研發(fā)一款全新的人工智能語言模型,這款模型規(guī)模上預(yù)計(jì)將具備與谷歌和OpenAI等業(yè)界巨頭相抗衡的實(shí)力。據(jù)悉,這款新
    的頭像 發(fā)表于 05-08 09:30 ?378次閱讀

    微軟自研AI模型即將問世

    微軟正悄然醞釀一項(xiàng)重大技術(shù)突破,據(jù)內(nèi)部消息人士透露,公司正全力訓(xùn)練一款名為“MAI-1”的自研人工智能大模型。這款模型備受期待,其規(guī)模龐大,足以與谷歌的Gemini和OpenAI的Ch
    的頭像 發(fā)表于 05-07 14:46 ?411次閱讀

    微軟MSN天氣服務(wù)引入全新AI模型

    微軟天氣預(yù)測領(lǐng)域取得了突破性的進(jìn)展,為MSN天氣服務(wù)引入了全新的AI預(yù)測模型。該模型微軟St
    的頭像 發(fā)表于 05-07 09:25 ?479次閱讀

    世界數(shù)字技術(shù)院發(fā)布:生成式AI安全測試標(biāo)準(zhǔn)及大語言模型

    據(jù)悉,上述兩款標(biāo)準(zhǔn)主要針對大型模型與生成式AI應(yīng)用領(lǐng)域的安全檢測設(shè)定了新基準(zhǔn)。參與制定工作的單位有OpenAI、螞蟻集團(tuán)、科大訊飛、谷歌、微軟、英偉達(dá)、百度、騰訊等多家知名企業(yè),其中,
    的頭像 發(fā)表于 04-17 16:51 ?931次閱讀

    微軟將在PowerToys運(yùn)用本地AI模型優(yōu)化粘貼功能

    據(jù)微軟官方宣布,Build 2024開發(fā)者大會上,公司將升級PowerToys,增加基于本地AI模型的高級粘貼功能。
    的頭像 發(fā)表于 04-11 11:37 ?298次閱讀

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬世界。用戶可以在這個(gè)世界
    的頭像 發(fā)表于 03-04 14:02 ?649次閱讀

    谷歌模型合成工具在哪找到

    谷歌模型合成工具可以谷歌的官方網(wǎng)站或相關(guān)的開發(fā)者平臺上找到。具體地,您可以嘗試訪問谷歌AI
    的頭像 發(fā)表于 03-01 18:13 ?1485次閱讀

    谷歌AI模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI模型Gemma現(xiàn)已在全球范圍內(nèi)開放使用。這一重要舉措不僅彰顯了谷歌AI
    的頭像 發(fā)表于 02-28 18:12 ?1028次閱讀

    谷歌發(fā)布開源AI模型Gemma

    近日,谷歌發(fā)布了全新AI模型Gemma,這款模型為各種規(guī)模的組織提供了前所未有的機(jī)會,以負(fù)責(zé)任的方式商業(yè)應(yīng)用中進(jìn)行分發(fā)。
    的頭像 發(fā)表于 02-28 17:38 ?753次閱讀

    谷歌推出AI擴(kuò)散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere,這款模型基于谷歌自主研發(fā)的“Space-Time U-Net”基礎(chǔ)架構(gòu),旨在實(shí)現(xiàn)視頻
    的頭像 發(fā)表于 02-04 13:49 ?917次閱讀