精品91麻豆免费免费国产在线,日韩欧美高清在免费线视频网站 ,久久精品国产一区二区三区不卡

DeepMind新年力作《學(xué)習(xí)和評估通用語言智能》，從全新的角度對跨任務(wù)NLP模型進行了評估，探討了要實現(xiàn)“通用語言智能”現(xiàn)如今的研究還缺失什么，以及如何實現(xiàn)通用語言智能。

2014年11月，那時候還沒有被廣泛認(rèn)知為“深度學(xué)習(xí)教父”的Geoffrey Hinton，在國外網(wǎng)站Reddit回答網(wǎng)友提問的活動“AMA” (Ask Me Anything) 中表示，他認(rèn)為未來5年最令人激動的領(lǐng)域，將是機器真正理解文字和視頻。

Hinton說：“5年內(nèi)，如果計算機沒能做到在觀看YouTube視頻后能夠講述發(fā)生了什么，我會感到很失望?！?/p>

幸好，現(xiàn)在計算機已經(jīng)能夠在觀看一段視頻后簡述其內(nèi)容，但距離Hinton所說的“真正理解文字和視頻”，還有很遠(yuǎn)的距離。

無獨有偶，統(tǒng)計機器學(xué)習(xí)大神Michael I. Jordan在2014年9月Reddit AMA中也提到，如果他有10億美金能夠組建研究項目，他會選擇構(gòu)建一個NASA規(guī)模的自然語言處理 (NLP) 計劃，包括語義學(xué)、語用學(xué)等分支。

Jordan說：“從學(xué)術(shù)上講，我認(rèn)為NLP是個引人入勝的問題，既讓人專注于高度結(jié)構(gòu)化的推理，也觸及了‘什么是思維 (mind)’ 這一核心，還非常實用，能讓世界變得更加美好?！?/p>

一直以來，NLP/NLU (自然語言理解) 都被視為人工智能桂冠上的明珠，不僅因其意義重大，也表示著目標(biāo)距我們遙不可及。

總之，NLP是個大難題。

前段時間在業(yè)內(nèi)廣泛流傳的一篇“人工智障”的文章，本質(zhì)上講的就是目前NLP領(lǐng)域的困境。縱使有谷歌BERT模型所帶來的各項指標(biāo)飛躍，但要讓計算機真正“理解”人類的語言，需要的恐怕不止是時間。

在最近一篇發(fā)布在Arxiv上的論文中，DeepMind的研究人員對“通用語言智能” (General Linguistic Intelligence) 做了定義，并探討了機器如何學(xué)習(xí)并實現(xiàn)通用語言智能。

DeepMind新年力作《學(xué)習(xí)和評估通用語言智能》

實現(xiàn)通用語言智能，首先需要統(tǒng)一的評估標(biāo)準(zhǔn)

DeepMind的研究人員從語言的角度出發(fā)，根據(jù)近來不斷發(fā)展的“通用人工智能”(AGI)的配套能力，也即能夠讓智能體與虛擬環(huán)境實現(xiàn)交互而發(fā)展出通用的探索、規(guī)劃和推理能力，將“通用語言智能”定義為：

能夠徹底應(yīng)對各種自然語言任務(wù)的復(fù)雜性；

有效存儲和重用各種表示 (representations)、組合模塊 (combinatorial modules, 如將單詞組成短語、句子和文檔的表示），以及先前獲得的語言知識，從而避免災(zāi)難性遺忘；

在從未經(jīng)歷過的新環(huán)境中適應(yīng)新的語言任務(wù)，即對領(lǐng)域轉(zhuǎn)換的魯棒性。

作者還指出，如今在NLP領(lǐng)域存在一種非常明顯且不好的趨勢，那就是越來越多的數(shù)據(jù)集通過眾包完成，量的確是大了，特別是在體現(xiàn)人類語言的“概括” (generalization) 和“抽象” (abstraction) 能力方面大打折扣，并不貼近現(xiàn)實中的自然分布。

此外，對于某一特定任務(wù)(比如問答)，存在多個不同的數(shù)據(jù)集。因此，單獨看在某個數(shù)據(jù)集上取得的結(jié)果，很容易讓我們高估所取得的進步。

所以，要實現(xiàn)通用語言智能，或者說朝著這個方向發(fā)展，首先需要確定一個統(tǒng)一的評估標(biāo)準(zhǔn)。在本文中，為了量化現(xiàn)有模型適應(yīng)新任務(wù)的速度，DeepMind的研究人員提出了一個基于在線前序編碼 (online prequential coding) 的新評估指標(biāo)。

接下來，就讓我們看看現(xiàn)有的各個state-of-the-art模型性能如何。

對現(xiàn)有最先進模型的“五大靈魂拷問”

作者選用了兩個預(yù)訓(xùn)練模型，一個基于BERT，一個基于ELMo。其中，BERT(base)擁有12個Transformer層，12個自注意力指針和768個隱藏層，這個預(yù)訓(xùn)練模型中有1.1億個參數(shù)。另一個則基于ELMo(base)，這個預(yù)訓(xùn)練模型有將近1億個參數(shù)，300個雙向LSTM層，100個輸出層。

另有BERT/ELMo(scratch)，表示沒有經(jīng)過預(yù)訓(xùn)練，從頭開始的模型。

首先，作者考察了需要多少與領(lǐng)域知識相關(guān)的訓(xùn)練樣本，兩個模型才能在SQuAD閱讀理解和MNLI自然語言推理這兩個任務(wù)上取得好的表現(xiàn)。

縱軸F1代表在SQuAD閱讀理解數(shù)據(jù)集上的得分函數(shù)，橫軸代表訓(xùn)練樣本量的對數(shù)值

答案是4萬。而且，與領(lǐng)域知識相關(guān)的訓(xùn)練樣本量超過4萬以后，兩個模型的提升都不明顯，非要說的話，BERT模型在兩項任務(wù)中比ELMo稍好一點。

那么，改用在其他數(shù)據(jù)集上預(yù)訓(xùn)練過的模型，同樣的任務(wù)性能又能提高多少呢？答案是一點點。但在代碼長度上，預(yù)訓(xùn)練過的模型要顯著優(yōu)于沒有經(jīng)過預(yù)訓(xùn)練的模型。

預(yù)訓(xùn)練模型(+supervised)與非預(yù)訓(xùn)練模型性能比較

作者考察的第三點是這些模型的泛化能力。實驗結(jié)果表明，在SQuAD數(shù)據(jù)集上表現(xiàn)最好的模型，移到其他數(shù)據(jù)集，比如Trivia、QuAC、QA-SRL、QA-ZRE后，仍然需要額外的相關(guān)訓(xùn)練樣本。這個結(jié)果在意料之中，但再次凸顯了“學(xué)會一個數(shù)據(jù)集”和“學(xué)會完成一項任務(wù)”之間存在的巨大鴻溝。

在SQuAD數(shù)據(jù)集上性能最優(yōu)的模型(得分超過80)，在其他數(shù)據(jù)集上分?jǐn)?shù)大幅降低

最后是有關(guān)學(xué)習(xí)課程 (curriculum) 和災(zāi)難性遺忘的問題。模型忘記此前學(xué)會的語言知識有多快？學(xué)習(xí)課程的設(shè)計與模型的性能之間有什么影響？

(上)將在SQuAD數(shù)據(jù)集上訓(xùn)練好的模型改到MNLI上；(下)將在SQuAD數(shù)據(jù)集上訓(xùn)練好的模型改到TriviaQA。兩種情況模型的性能都大幅下降。

BERT模型用隨機訓(xùn)練課程在各種數(shù)據(jù)集上取得的結(jié)果。實際上經(jīng)過5萬次迭代后，模型就能基本完成各項任務(wù)(超過60分)。

從實驗結(jié)果看，在SQuAD數(shù)據(jù)集上訓(xùn)練好的模型改到MNLI或TriviaQA這些不同數(shù)據(jù)集后，模型性能很快出現(xiàn)大幅下降，說明災(zāi)難性遺忘發(fā)生。

雖然采用連續(xù)學(xué)習(xí)的方法，隨機初始化，5萬次迭代后，兩個模型尤其是BERT，基本上能在各個數(shù)據(jù)集上都達到差強人意的表現(xiàn)。

通過隨機訓(xùn)練，20萬次迭代以后，BERT和ELMo在多項任務(wù)上的得分

但缺點是，這樣的隨機訓(xùn)練模型在開始不需要樣本，轉(zhuǎn)換新任務(wù)以后也不需要保留此前學(xué)會的東西。因此，在連續(xù)學(xué)習(xí)的過程中，知識遷移究竟是如何發(fā)生的，目前還不得而知。

綜上，對一系列在各個不同NLP任務(wù)上取得當(dāng)前最佳性能的模型進行實證評估后，DeepMind的研究人員得出結(jié)論：雖然NLP領(lǐng)域如今在模型設(shè)計方面取得了令人矚目的進展，而且這些模型在很多時候都能同時完成不止一項任務(wù)，但它們?nèi)匀恍枰罅颗c領(lǐng)域知識相關(guān)的訓(xùn)練樣本 (in-domain training example)，并且很容易發(fā)生災(zāi)難性遺忘。

實現(xiàn)通用語言智能，我們還需要什么？

通過上述實驗可以發(fā)現(xiàn)，現(xiàn)有的state-of-the-art NLP模型幾乎全部都是：

擁有超大規(guī)模參數(shù)的深度學(xué)習(xí)模型；

事先以監(jiān)督或非監(jiān)督的的方式在訓(xùn)練樣本上經(jīng)過訓(xùn)練；

通常包含了多個針對某項特定任務(wù)的構(gòu)件以完成多項任務(wù)；

默認(rèn)或者說假設(shè)某項任務(wù)的數(shù)據(jù)分布是平均的。

這種方法雖然合理，但仍舊需要大量與領(lǐng)域知識相關(guān)的訓(xùn)練樣本，并且非常容易發(fā)生災(zāi)難性遺忘。

因此，要實現(xiàn)通用語言智能，DeepMind研究人員在論文最后的討論中指出，我們還需要：更加復(fù)雜的遷移學(xué)習(xí)和連續(xù)學(xué)習(xí)方法 (transfer and continual learning method)，能讓模型快速跨領(lǐng)域執(zhí)行任務(wù)的記憶模塊 (memory module)，訓(xùn)練課程 (training curriculum) 的選擇對模型性能的影響也很重要，在生成語言模型 (generative language models) 方面的進展，也將有助于實現(xiàn)通用語言智能。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

DeepMind

DeepMind

+關(guān)注

關(guān)注
0

文章
129

瀏覽量
10800
nlp

nlp

+關(guān)注

關(guān)注
1

文章
482

瀏覽量
21969

原文標(biāo)題：DeepMind：實現(xiàn)通用語言智能我們還缺什么？

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

鴻蒙原生應(yīng)用元服務(wù)開發(fā)-初識倉頡開發(fā)語言

倉頡編程語言是一種面向全場景應(yīng)用開發(fā)的通用編程語言，可以兼顧開發(fā)效率和運行性能，并提供良好的編程體驗，主要具有如下特點：語法簡明高效：倉頡編程語言提供了一系列簡明高效的語法，旨在減

發(fā)表于 08-15 10:00

鴻蒙原生應(yīng)用元服務(wù)開發(fā)-初識倉頡開發(fā)語言

發(fā)表于 07-30 17:49

【《大語言模型應(yīng)用指南》閱讀體驗】+ 俯瞰全書

的機會！本人曾經(jīng)也參與過語音識別產(chǎn)品的開發(fā)，包括在線和離線識別，但僅是應(yīng)用語言模型實現(xiàn)端側(cè)的應(yīng)用開發(fā)，相當(dāng)于調(diào)用模型的接口函數(shù)，實際對模型的設(shè)計、訓(xùn)練和運行機理并不了解，我想通過學(xué)習(xí)《大語言模型

發(fā)表于 07-21 13:35

大語言模型的預(yù)訓(xùn)練

隨著人工智能技術(shù)的飛速發(fā)展，自然語言處理（NLP）作為人工智能領(lǐng)域的一個重要分支，取得了顯著的進步。其中，大語言模型（Large Language Model, LLM）憑借其強大的

發(fā)表于 07-11 10:11 ?316次閱讀

nlp神經(jīng)語言和NLP自然語言的區(qū)別和聯(lián)系

來改變我們的行為和情感。NLP的目標(biāo)是幫助人們實現(xiàn)自我改進，提高溝通技巧，增強領(lǐng)導(dǎo)力和解決問題的能力。 NLP的主要組成部分包括：感知：了解我們如何接收和處理信息。語言：研究

發(fā)表于 07-09 10:35 ?636次閱讀

大模型應(yīng)用之路：從提示詞到通用人工智能（AGI）

鋪平道路。基于AI大模型的推理功能，結(jié)合了RAG（檢索增強生成）、智能體（Agent）、知識庫、向量數(shù)據(jù)庫、知識圖譜等先進技術(shù)，我們向實現(xiàn)真正的AGI（通用人工智能）邁出了重要步伐。

發(fā)表于 06-14 10:20 ?2004次閱讀

大模型應(yīng)用之路：從提示詞到<b class='flag-5'>通用人工智能</b>（AGI）

谷歌DeepMind推出SIMI通用AI智能體

近日，谷歌的DeepMind團隊發(fā)布了其最新研究成果——SIMI（Scalable Instructable Multiworld Agent），這是一個通用人工智能智能體，能夠在多種3D虛擬環(huán)境

發(fā)表于 03-18 11:39 ?820次閱讀

fpga通用語言是什么

FPGA（現(xiàn)場可編程門陣列）的通用語言主要是指用于描述FPGA內(nèi)部邏輯結(jié)構(gòu)和行為的硬件描述語言。目前，Verilog HDL和VHDL是兩種最為廣泛使用的FPGA編程語言。

發(fā)表于 03-15 14:36 ?438次閱讀

“單純靠大模型無法實現(xiàn) AGI”！萬字長文看人工智能演進

人工智能是指讓計算機或機器具有類似于人類智能的能力，如學(xué)習(xí)、推理、解決問題和使用語言、常識、創(chuàng)造力、情感和道德等。

發(fā)表于 02-19 14:22 ?988次閱讀

“單純靠大模型無法<b class='flag-5'>實現(xiàn)</b> AGI”！萬字長文看人工<b class='flag-5'>智能</b>演進

大語言模型使用指南

在信息爆炸的時代，我們渴望更智能、更高效的語言處理工具。GPT-3.5等大語言模型的崛起為我們提供了前所未有的機會。這不僅是技術(shù)的進步，更是

發(fā)表于 12-29 14:18 ?609次閱讀

思必馳探討大模型下的智能座艙新生態(tài)

為應(yīng)對行業(yè)挑戰(zhàn)，思必馳發(fā)布了定位為“針對垂域的、具有通用智能的行業(yè)語言大模型”DFM-2。它不僅具備通用語言計算大模型的所有AGI特性，包括文案創(chuàng)作、代碼生成、邏輯推理、常識問答、多輪

發(fā)表于 12-19 14:55 ?420次閱讀

思必馳探討大模型下的<b class='flag-5'>智能</b>座艙新生態(tài)

使用go語言實現(xiàn)一個grpc攔截器

在開發(fā)grpc服務(wù)時，我們經(jīng)常會遇到一些通用的需求，比如：日志、鏈路追蹤、鑒權(quán)等。這些需求可以通過grpc攔截器來實現(xiàn)。本文使用go語言來實現(xiàn)

發(fā)表于 12-18 10:13 ?574次閱讀

GT Designer3 畫面多語言切換功能

新建工程后點擊“系統(tǒng)”---選擇 “語言切換”---勾選“使用語言切換”----填寫“語言切換軟元件 D200（可自定義PLC未使用的軟元件）”通過改變語言切換軟元件D200的值可對相

發(fā)表于 12-04 15:07 ?1232次閱讀

基于VHDL語言實現(xiàn)遠(yuǎn)程防盜報警設(shè)計

電子發(fā)燒友網(wǎng)站提供《基于VHDL語言實現(xiàn)遠(yuǎn)程防盜報警設(shè)計.pdf》資料免費下載

發(fā)表于 11-08 14:33 ?0次下載

基于XML語言描述的接口實現(xiàn)方法

電子發(fā)燒友網(wǎng)站提供《基于XML語言描述的接口實現(xiàn)方法.pdf》資料免費下載

發(fā)表于 11-06 10:39 ?0次下載

搜索歷史

我們?nèi)绾螌崿F(xiàn)通用語言智能

評論

鴻蒙原生應(yīng)用元服務(wù)開發(fā)-初識倉頡開發(fā)語言

鴻蒙原生應(yīng)用元服務(wù)開發(fā)-初識倉頡開發(fā)語言

【《大語言模型應(yīng)用指南》閱讀體驗】+ 俯瞰全書

大語言模型的預(yù)訓(xùn)練

nlp神經(jīng)語言和NLP自然語言的區(qū)別和聯(lián)系

大模型應(yīng)用之路：從提示詞到通用人工智能（AGI）

谷歌DeepMind推出SIMI通用AI智能體

fpga通用語言是什么

“單純靠大模型無法實現(xiàn) AGI”！萬字長文看人工智能演進

大語言模型使用指南

思必馳探討大模型下的智能座艙新生態(tài)

使用go語言實現(xiàn)一個grpc攔截器

GT Designer3 畫面多語言切換功能

基于VHDL語言實現(xiàn)遠(yuǎn)程防盜報警設(shè)計

基于XML語言描述的接口實現(xiàn)方法