0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI的研究人員提出了一種全新的AI安全策略——迭代放大法

nlfO_thejiangme ? 來(lái)源:未知 ? 作者:李倩 ? 2018-10-26 10:52 ? 次閱讀

近日,OpenAI的研究人員提出了一種全新的AI安全策略——迭代放大法(iterated amplification),通過(guò)描述如何將一個(gè)復(fù)雜的任務(wù)分解成簡(jiǎn)單的子任務(wù)而不是提供標(biāo)簽數(shù)據(jù)或獎(jiǎng)勵(lì)函數(shù),實(shí)現(xiàn)了對(duì)于復(fù)雜行為和目標(biāo)的描述。雖然這一方法還處于比較初級(jí)的階段,但研究人員認(rèn)為這種方法將為AI安全提供一種大規(guī)模的實(shí)現(xiàn)手段。

如果我們想要訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)模型完成特定的任務(wù),我們一定需要訓(xùn)練信號(hào)來(lái)評(píng)價(jià)模型的表現(xiàn)并幫助模型不斷學(xué)習(xí)和改進(jìn)。例如監(jiān)督學(xué)習(xí)中的標(biāo)簽和強(qiáng)化學(xué)習(xí)中的獎(jiǎng)勵(lì)函數(shù)就是訓(xùn)練訊號(hào)。機(jī)器學(xué)習(xí)體系中的一個(gè)重要假設(shè)就是這些訊號(hào)已經(jīng)存在,并且算法可以按照它來(lái)學(xué)習(xí)。但實(shí)際情況是訓(xùn)練信號(hào)可能來(lái)自于不知道的某個(gè)地方。如果我們沒有訓(xùn)練信號(hào)就意味著我們沒有辦法學(xué)習(xí)。如果我們得到的是錯(cuò)誤信號(hào),那么算法可能會(huì)得到無(wú)意識(shí)的甚至危險(xiǎn)的結(jié)果。所以對(duì)于新的任務(wù)和AI安全來(lái)說(shuō),提高得到訓(xùn)練訊號(hào)的能力是十分必要且極具價(jià)值的。

那么讓我們看看目前是怎么獲取訓(xùn)練信號(hào)的呢?有時(shí)候我們可以利用算法得到,比如在圍棋游戲中可以通過(guò)計(jì)數(shù)評(píng)分得到信號(hào)。不過(guò)大多數(shù)真實(shí)世界的任務(wù)并沒有一個(gè)數(shù)學(xué)形式表達(dá)的信號(hào),但通常我們可以人工的手段來(lái)獲取訓(xùn)練信號(hào)。但實(shí)際情況是,很多復(fù)雜的任務(wù)已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了人類的認(rèn)知能力,我們沒辦法判斷模型的輸出是否正確,例如設(shè)計(jì)一個(gè)復(fù)雜的運(yùn)輸系統(tǒng)或者管理龐大計(jì)算機(jī)網(wǎng)絡(luò)安全細(xì)節(jié)的管理系統(tǒng)這樣的任務(wù),或者是預(yù)測(cè)全球長(zhǎng)期氣候趨勢(shì)這種復(fù)雜的任務(wù)。

需要不同訓(xùn)練信號(hào)的問題,訓(xùn)練序號(hào)可以來(lái)自表達(dá)式評(píng)價(jià)、人類反饋,但有的任務(wù)超出了人類的能力。

本文提出的迭代放大,是一種在確定性假設(shè)下為后續(xù)任務(wù)生成訓(xùn)練假設(shè)的方法。實(shí)際上,雖然人類不能在全局上直接把握復(fù)雜的問題,但我們可以假設(shè)人類可以有效的評(píng)估復(fù)雜任務(wù)中的一小塊任務(wù)是否符合要求。例如在計(jì)算機(jī)網(wǎng)絡(luò)安全的例子中,人們可以將“防御一系列針對(duì)于服務(wù)器和路由器的攻擊”分解為“針對(duì)服務(wù)器的攻擊”和“針對(duì)路由的攻擊”以及“兩個(gè)攻擊間可能的相關(guān)性”。此外,我們還可以假設(shè),人類可以承擔(dān)很少的一部分任務(wù),例如“識(shí)別出日志中的一行可疑記錄”。如果人類的分解任務(wù)能力和分擔(dān)任務(wù)能力得以落實(shí),這兩項(xiàng)假設(shè)得以成立,那我們就可以為一項(xiàng)龐大的任務(wù)建立訓(xùn)練信號(hào),這些訊號(hào)來(lái)自于人類針對(duì)分解任務(wù)訊號(hào)的組合。

迭代放大的機(jī)制

研究人員在實(shí)際訓(xùn)練放大的過(guò)程中,首先訓(xùn)練AI系統(tǒng)從一個(gè)很小的子任務(wù)開始學(xué)習(xí),通過(guò)尋求人類的幫助(標(biāo)簽/獎(jiǎng)勵(lì)信號(hào))來(lái)學(xué)會(huì)解決這一子問題。隨后讓系統(tǒng)學(xué)習(xí)一個(gè)稍大的問題,這時(shí)候需要人類將較大的任務(wù)進(jìn)行分解,AI系統(tǒng)依靠上一步的學(xué)習(xí)來(lái)解決這些問題。研究人員將這種解決方案用于那些稍微困難的問題,在這些問題中系統(tǒng)從人類處得到訓(xùn)練信號(hào),來(lái)直接訓(xùn)練二級(jí)任務(wù)(此時(shí)無(wú)需人類幫助)。

隨著訓(xùn)練的進(jìn)行,研究人員繼續(xù)為AI提供更為復(fù)雜的復(fù)合任務(wù),不斷構(gòu)建出訓(xùn)練信號(hào)。如果這個(gè)過(guò)程得以完成,AI系統(tǒng)將學(xué)會(huì)解決高度復(fù)雜的問題,盡管這個(gè)系統(tǒng)一開始沒有從任務(wù)中獲得直接的訓(xùn)練信號(hào)。

這一過(guò)程在一定程度上與AlphaGo Zero專家迭代過(guò)程很像,不過(guò)個(gè)專家迭代在強(qiáng)化現(xiàn)存的訓(xùn)練信號(hào),而迭代放大則從零開始構(gòu)建訓(xùn)練信號(hào)。它也和最近的一些問題分解的算法很像,但區(qū)別在于它可以用于沒有先前訓(xùn)練信號(hào)的問題。

實(shí) 驗(yàn)

先前的實(shí)驗(yàn)表明,直接用AI系統(tǒng)解決超越人類能力的問題十分困難,同時(shí)利用人類作為訓(xùn)練信號(hào)也會(huì)引入復(fù)雜性。所以研究人員的第一個(gè)實(shí)驗(yàn)在于嘗試放大了算法的訓(xùn)練信號(hào),來(lái)驗(yàn)證這種方法可以在簡(jiǎn)單任務(wù)的有效性。同時(shí)也限制了對(duì)于監(jiān)督學(xué)習(xí)的注意力。研究人員在5個(gè)示例算法任務(wù)上進(jìn)行了嘗試。這五個(gè)算法示例都有具體的數(shù)學(xué)表達(dá),但研究人員先排除算法信號(hào),了利用一步步從簡(jiǎn)單到復(fù)雜的方法從零開始解決。利用迭代放大的方法,從一些不直接的子任務(wù)中間接學(xué)習(xí)出訓(xùn)練信號(hào)。

在五個(gè)任務(wù)中(排列、序列賦值、通配符匹配、最短路徑、查找并集),新的方法可以與表達(dá)式方法獲得同等甚至更好的效果。

在沒有l(wèi)abel的情況下迭代放大法獲得了與監(jiān)督學(xué)習(xí)相同甚至更好的結(jié)果

放大法在尋求解決那些超越人類直接認(rèn)知和能力的問題,通過(guò)迭代的過(guò)程使得人類可以提供間接的監(jiān)督信號(hào)。這項(xiàng)工作同時(shí)也建立在人類反饋的基礎(chǔ)上,通過(guò)實(shí)現(xiàn)獎(jiǎng)勵(lì)預(yù)測(cè)系統(tǒng),接下來(lái)的版本將會(huì)包含來(lái)自于真實(shí)人類的反饋。目前研究人員僅僅在探索的初級(jí)階段,隨著研究的深入和規(guī)模的擴(kuò)大將會(huì)為很多復(fù)雜的問題帶來(lái)新的可能。

人類反饋

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29362

    瀏覽量

    267647
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4257

    瀏覽量

    62226
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8320

    瀏覽量

    132165

原文標(biāo)題:OpenAI提出全新AI安全策略—迭代放大法,助力機(jī)器實(shí)現(xiàn)復(fù)雜目標(biāo)學(xué)習(xí)

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ZigBee接入EPA網(wǎng)絡(luò)的安全策略

    ZigBee接入EPA網(wǎng)絡(luò)的安全策略針對(duì)ZigBee技術(shù)的特點(diǎn),結(jié)合EPA控制網(wǎng)絡(luò)的安全規(guī)范與工業(yè)現(xiàn)場(chǎng)實(shí)際應(yīng)用的需要,提出ZigBee接入EPA網(wǎng)絡(luò)的安全策略與基于
    發(fā)表于 03-19 16:47

    一種參數(shù)自調(diào)節(jié)優(yōu)化控制策略

    2019年第1期《電工技術(shù)學(xué)報(bào)》上撰文,針對(duì)虛擬同步發(fā)電機(jī)(VSG)雙機(jī)并聯(lián)系統(tǒng)在采用固定的轉(zhuǎn)動(dòng)慣量及阻尼系數(shù)時(shí)無(wú)法兼顧有功功率振蕩和頻率波動(dòng)的問題,該文提出一種參數(shù)自調(diào)節(jié)優(yōu)化控制策略。首先,...
    發(fā)表于 09-03 07:50

    一種參數(shù)自調(diào)節(jié)優(yōu)化控制策略

    和頻率波動(dòng)的問題,該文提出一種參數(shù)自調(diào)節(jié)優(yōu)化控制策略。首先,建立VSG雙機(jī)并聯(lián)系統(tǒng)的小信號(hào)模型,分析轉(zhuǎn)動(dòng)慣量及阻尼系數(shù)對(duì)輸出有功特性的影響;其次,在滿足系統(tǒng)動(dòng)穩(wěn)態(tài)性能的轉(zhuǎn)動(dòng)慣量及阻尼系數(shù)限定取值范圍內(nèi),根據(jù)...
    發(fā)表于 09-09 09:08

    基于多維整數(shù)空間的安全策略沖突檢測(cè)與消解

    針對(duì)當(dāng)前大部分安全策略沖突檢測(cè)與消解算法缺少靈活性和擴(kuò)展性等缺點(diǎn),提出一種基于多維整數(shù)空間的安全策略形式化描述方法,在此基礎(chǔ)上設(shè)計(jì)了一種可擴(kuò)
    發(fā)表于 03-24 08:49 ?13次下載

    基于有向圖模型的網(wǎng)絡(luò)安全策略沖突研究

    保證安全策略的協(xié)同工作和致性是實(shí)現(xiàn)分布式系統(tǒng)安全管理需要首先解決的問題。本文提出了一種可適應(yīng)的安全策略
    發(fā)表于 01-27 15:12 ?11次下載

    一種基于群組的無(wú)線傳感器網(wǎng)絡(luò)安全策略_師鳴若

    一種基于群組的無(wú)線傳感器網(wǎng)絡(luò)安全策略_師鳴若
    發(fā)表于 03-19 11:46 ?0次下載

    基于可信計(jì)算的多級(jí)安全策略TCBMLSP分析

    個(gè)重要方面是安全訪問控制策略的建立,其中具有代表性的是BLP、BIBA策略模型。 針對(duì)現(xiàn)有安全策略模型BLP與BIBA結(jié)合應(yīng)用存在可用性
    發(fā)表于 11-09 17:01 ?4次下載
    基于可信計(jì)算的多級(jí)<b class='flag-5'>安全策略</b>TCBMLSP分析

    云計(jì)算環(huán)境的多域安全策略驗(yàn)證管理技術(shù)

    為了有效管理云系統(tǒng)間跨域互操作中安全策略的實(shí)施,提出一種適用于云計(jì)算環(huán)境的多域安全策略驗(yàn)證管理技術(shù)。首先,研究
    發(fā)表于 12-15 13:46 ?0次下載
    云計(jì)算環(huán)境的多域<b class='flag-5'>安全策略</b>驗(yàn)證管理技術(shù)

    研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列,成功將電子皮膚的探測(cè)能力擴(kuò)展到7,實(shí)現(xiàn)溫度、濕度、紫外光、磁、應(yīng)變、壓力和接近等多種外界刺激的實(shí)時(shí)同步監(jiān)測(cè)。
    的頭像 發(fā)表于 01-24 15:15 ?7162次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

    帶你了解AI研究人員年薪百萬(wàn)背后的真相

    近期,紐約時(shí)報(bào)記者卡德梅茨爆料了條令人「震驚」的消息——AI 研究人員年薪百萬(wàn)(哪怕是在 OpenAI 這樣的非營(yíng)利機(jī)構(gòu)里),個(gè)個(gè)都是人生贏家。
    的頭像 發(fā)表于 05-28 17:46 ?5627次閱讀

    OpenAI提出了一種回報(bào)設(shè)置方法RND

    在開發(fā)RND之前,OpenAI研究人員和加州大學(xué)伯克利分校的學(xué)者進(jìn)行了合作,他們測(cè)試了在沒有環(huán)境特定回報(bào)的情況下,智能體的學(xué)習(xí)情況。因?yàn)閺睦碚撋蟻?lái)說(shuō),好奇心提供了一種更簡(jiǎn)單的方法來(lái)教授智能體如何與各種環(huán)境進(jìn)行交互,它不需要人為
    的頭像 發(fā)表于 11-05 15:15 ?3107次閱讀

    以色列研究人員開發(fā)出了一種能夠識(shí)別不同刺激的新型傳感系統(tǒng)

    據(jù)麥姆斯咨詢報(bào)道,海法以色列理工學(xué)院的研究人員開發(fā)出了一種能夠識(shí)別并區(qū)分不同刺激的創(chuàng)新型傳感系統(tǒng)。該系統(tǒng)基于折紙藝術(shù),結(jié)合了以色列理工學(xué)院開發(fā)的智能墨水材料。
    發(fā)表于 05-21 08:45 ?880次閱讀

    研究人員出了一種新的基于深度學(xué)習(xí)的策略

    蘇黎世聯(lián)邦理工學(xué)院的研究人員最近推出了一種新的基于深度學(xué)習(xí)的策略,該策略可以在不需要大量真實(shí)數(shù)據(jù)的情況下在機(jī)器人中實(shí)現(xiàn)觸覺傳感。在arXiv
    的頭像 發(fā)表于 03-26 15:47 ?2547次閱讀

    中美研究人員合作開發(fā)出了一種可以預(yù)測(cè)新冠肺炎病情的AI工具

    中美兩國(guó)研究人員合作,開發(fā)出一種實(shí)驗(yàn)性AI工具,可以準(zhǔn)確預(yù)測(cè)哪些新冠肺炎(COVID-19)患者的病情會(huì)發(fā)展成嚴(yán)重的呼吸系統(tǒng)疾病。
    發(fā)表于 04-01 14:30 ?613次閱讀

    MIT研究人員提出了一種制造軟氣動(dòng)執(zhí)行器的新方法

    麻省理工學(xué)院 (MIT) 的研究人員創(chuàng)造了一種新的制造技術(shù),可以制造出更具成本效益的軟氣動(dòng)執(zhí)行器。
    的頭像 發(fā)表于 05-06 16:38 ?1565次閱讀
    MIT<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>制造軟氣動(dòng)執(zhí)行器的新方法