0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT實(shí)現(xiàn)原理

汽車電子技術(shù) ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2023-02-13 17:32 ? 次閱讀

ChatGPT實(shí)現(xiàn)原理

用自然語(yǔ)言與計(jì)算機(jī)進(jìn)行通信,ChatGPT實(shí)現(xiàn)了,那么ChatGPT實(shí)現(xiàn)原理是什么?

ChatGPT(Generative Pre-train Transformer)是由OpenAI發(fā)明的一種自然語(yǔ)言處理技術(shù)。它是一種預(yù)訓(xùn)練的深度學(xué)習(xí)模型,可以用來(lái)生成文本,識(shí)別語(yǔ)義,做文本分類等任務(wù)。

ChatGPT實(shí)現(xiàn)原理

火爆的ChatGPT,得益于AIGC 背后的關(guān)鍵技術(shù)NLP(Natural LanguageProcessing,自然語(yǔ)言處理)得到突破。自然語(yǔ)言處理應(yīng)用在過(guò)去十年呈爆炸式增長(zhǎng),NLP技術(shù)是一種自然語(yǔ)言處理技術(shù),用于計(jì)算機(jī)中模擬人類的對(duì)話和文本理解。主要源于AI大模型化的NLP技術(shù)突破是將深度學(xué)習(xí)技術(shù)與傳統(tǒng)的NLP方法結(jié)合在一起,從而更好地提高NLP技術(shù)的準(zhǔn)確性和效率。大模型化的NLP技術(shù)能夠更好地支持企業(yè)進(jìn)行大規(guī)模的語(yǔ)料內(nèi)容分析,并為企業(yè)更好地進(jìn)行文本分析提供幫助。

NLP類模型要理解單詞的含義,還要理解如何造句和給出上下文有意義的回答,甚至使用合適的俚語(yǔ)和專業(yè)詞匯。

我們看到ChatGPT的回答是這樣的:

pYYBAGPqA6aAWexfAABOwAN7JNs369.png

ChatGPT的原理是基于自回歸語(yǔ)言模型(Auto-Regressive Language Model),它是一種基于深度學(xué)習(xí)的自然語(yǔ)言處理技術(shù),可以用來(lái)生成自然語(yǔ)言文本。它使用一種叫做Transformer的模型,它可以訓(xùn)練一個(gè)模型來(lái)預(yù)測(cè)下一個(gè)詞,從而生成文本。

人類反饋強(qiáng)化學(xué)習(xí)

同時(shí)OpenAI采用了 RLHF(Reinforcement Learning from Human Feedbac,人類反饋強(qiáng)化學(xué)習(xí)) 技術(shù)對(duì) ChatGPT 進(jìn)行了訓(xùn)練,而加入了更多人工監(jiān)督進(jìn)行微調(diào)。所以我們可以看到,一些錯(cuò)誤的信息會(huì)逐步被更正。而且在很多用戶的測(cè)試中可以發(fā)現(xiàn),若用戶指出其錯(cuò)誤,模型會(huì)聽(tīng)取意見(jiàn)并優(yōu)化答案。

InstructGPT/GPT3.5(ChatGPT的前身)與GPT-3的主要區(qū)別在于,新加入了被稱為RLHF(Reinforcement Learning from Human Feedback,人類反饋強(qiáng)化學(xué)習(xí))。

InstructGPT的目標(biāo)就是緩解這種生成回復(fù)與真實(shí)回復(fù)之間的偏置產(chǎn)生更加符合人類預(yù)期的回復(fù)。

chatGPT是一種基于轉(zhuǎn)移學(xué)習(xí)的大型語(yǔ)言模型,它使用GPT-2 (Generative PretrainedTransformer2)模型的技術(shù),使用了transformer的架構(gòu),并進(jìn)行了進(jìn)一步的訓(xùn)練和優(yōu)化。

chatGPT是在GPT-2模型的基礎(chǔ)上進(jìn)一步訓(xùn)練和優(yōu)化而得到的。 它使用了更多的語(yǔ)料庫(kù),并且進(jìn)行了專門的訓(xùn)練來(lái)提高在對(duì)話系統(tǒng)中的表現(xiàn)。這使得chatGPT能夠在對(duì)話中白然地回應(yīng)用戶的輸入,并且能夠生成流暢、連貫、通順的文本。

那么接下來(lái)我們來(lái)看下什么是InstructGPT。從字面上來(lái)看,顧名思義,它就是指令式的GPT,“which is trained to follow an instruction in a prompt and provide a detailed response”。接下來(lái)我們來(lái)看下InstructGPT論文中的主要原理:

pYYBAGPknAmAfqGdAAFfaj7uGl0745.png

InstructGPT整體訓(xùn)練流程

從該圖可以看出,InstructGPT是基于GPT-3模型訓(xùn)練出來(lái)的,具體步驟如下:

步驟1.)從GPT-3的輸入語(yǔ)句數(shù)據(jù)集中采樣部分輸入,基于這些輸入,采用人工標(biāo)注完成希望得到輸出結(jié)果與行為,然后利用這些標(biāo)注數(shù)據(jù)進(jìn)行GPT-3有監(jiān)督的訓(xùn)練。該模型即作為指令式GPT的冷啟動(dòng)模型。

步驟2.)在采樣的輸入語(yǔ)句中,進(jìn)行前向推理獲得多個(gè)模型輸出結(jié)果,通過(guò)人工標(biāo)注進(jìn)行這些輸出結(jié)果的排序打標(biāo)。最終這些標(biāo)注數(shù)據(jù)用來(lái)訓(xùn)練reward反饋模型。

步驟3.)采樣新的輸入語(yǔ)句,policy策略網(wǎng)絡(luò)生成輸出結(jié)果,然后通過(guò)reward反饋模型計(jì)算反饋,該反饋回過(guò)頭來(lái)作用于policy策略網(wǎng)絡(luò)。以此反復(fù),這里就是標(biāo)準(zhǔn)的reinforcement learning強(qiáng)化學(xué)習(xí)的訓(xùn)練框架了。

所以總結(jié)起來(lái)ChatGPT(對(duì)話GPT)其實(shí)就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通過(guò)人工標(biāo)注方式訓(xùn)練出強(qiáng)化學(xué)習(xí)的冷啟動(dòng)模型與reward反饋模型,最后通過(guò)強(qiáng)化學(xué)習(xí)的方式學(xué)習(xí)出對(duì)話友好型的ChatGPT模型。

InstructGPT的訓(xùn)練實(shí)際上是分為三個(gè)階段的,第一階段就是我們上文所述,利用人工標(biāo)注的數(shù)據(jù)微調(diào)GPT3;第二階段,需要訓(xùn)練一個(gè)評(píng)價(jià)模型即Reward Model,該模型需學(xué)習(xí)人類對(duì)于模型回復(fù)的評(píng)價(jià)方式,對(duì)于給定的上文與生成回復(fù)給出分?jǐn)?shù);第三階段,利用訓(xùn)練好的Reward Model作為反饋信號(hào),去指導(dǎo)GPT進(jìn)一步進(jìn)行微調(diào),將目標(biāo)設(shè)定為Reward分?jǐn)?shù)最大化,從而使模型產(chǎn)生更加符合人類偏好的回復(fù)。

自然語(yǔ)言理解的不同發(fā)展階段

在20世紀(jì)60年代,隨著計(jì)算機(jī)技術(shù)的發(fā)展,自然語(yǔ)言處理技術(shù)也進(jìn)一步提升。當(dāng)時(shí),美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)成立了“自然語(yǔ)言處理研究計(jì)劃”,專門用于支持自然語(yǔ)言處理技術(shù)的研究。同時(shí),英國(guó)也成立了“自然語(yǔ)言處理研究室(Natural Language Processing Research Laboratory)”,專門致力于自然語(yǔ)言處理技術(shù)的研究與應(yīng)用。

在20世紀(jì)70年代,自然語(yǔ)言處理技術(shù)又迎來(lái)了一個(gè)新的發(fā)展階段。這一時(shí)期,自然語(yǔ)言處理技術(shù)發(fā)展到了語(yǔ)言學(xué)理論與計(jì)算機(jī)科學(xué)相結(jié)合的階段。其中,語(yǔ)義學(xué)和句法學(xué)等語(yǔ)言學(xué)理論成為自然語(yǔ)言處理技術(shù)研究的重要基礎(chǔ)。

在20世紀(jì)80年代,隨著人工智能技術(shù)的進(jìn)一步發(fā)展,自然語(yǔ)言處理技術(shù)也進(jìn)入了一個(gè)新的階段。這一時(shí)期,自然語(yǔ)言處理技術(shù)得到了廣泛應(yīng)用,并取得了一系列突破性成果。例如,英國(guó)語(yǔ)言工程研究所(LEL)在1983年成功開(kāi)發(fā)出了世界上第一個(gè)基于人工智能的翻譯系統(tǒng),該系統(tǒng)能夠?qū)⒂⒄Z(yǔ)翻譯成法語(yǔ)。

在20世紀(jì)90年代,自然語(yǔ)言處理技術(shù)進(jìn)一步發(fā)展壯大。隨著互聯(lián)網(wǎng)的普及,自然語(yǔ)言處理技術(shù)在搜索引擎、社交媒體、客服機(jī)器人等領(lǐng)域得到廣泛應(yīng)用。此外,自然語(yǔ)言處理技術(shù)還進(jìn)入了深度學(xué)習(xí)階段,開(kāi)始使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語(yǔ)言模型的建立和訓(xùn)練,從而提升自然語(yǔ)言處理技術(shù)的準(zhǔn)確性和效率。如今,自然語(yǔ)言處理技術(shù)已經(jīng)成為人工智能領(lǐng)域的重要組成部分,并在多個(gè)領(lǐng)域得到廣泛應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29347

    瀏覽量

    267630
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5429

    瀏覽量

    120787
  • 自然語(yǔ)言處理
    +關(guān)注

    關(guān)注

    1

    文章

    586

    瀏覽量

    13464
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1009

    瀏覽量

    6343
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1523

    瀏覽量

    7247
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    利用ChatGPT通過(guò)Shell腳本來(lái)實(shí)現(xiàn)日志分析

    ChatGPT自出道以來(lái),其出色的代碼能力被眾多程序員追捧,今天浩道就運(yùn)維工作中常見(jiàn)的日志分析場(chǎng)景,利用ChatGPT讓它通過(guò)Shell腳本來(lái)實(shí)現(xiàn)日志分析
    的頭像 發(fā)表于 04-07 09:09 ?3015次閱讀

    【國(guó)產(chǎn)FPGA+OMAPL138開(kāi)發(fā)板體驗(yàn)】(原創(chuàng))6.FPGA連接ChatGPT 4

    。”(FPGA禮貌地表示感謝,并掛斷電話) 接下來(lái)我將開(kāi)始一步一步實(shí)現(xiàn)。編寫一個(gè)用FPGA訪問(wèn)ChatGPT4的程序代碼是一個(gè)復(fù)雜的過(guò)程,涉及到硬件描述語(yǔ)言(如VHDL或Verilog)的編程、網(wǎng)絡(luò)通信
    發(fā)表于 02-14 21:58

    在FPGA設(shè)計(jì)中是否可以應(yīng)用ChatGPT生成想要的程序呢

    當(dāng)下AI人工智能崛起,很多開(kāi)發(fā)領(lǐng)域都可看到ChatGPT的身影,F(xiàn)PGA設(shè)計(jì)中,是否也可以用ChatGPT輔助設(shè)計(jì)呢?
    發(fā)表于 03-28 23:41

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來(lái)了

    和情緒的選項(xiàng) 實(shí)時(shí)視頻捕捉,在與ChatGPT 交互時(shí)無(wú)需發(fā)送照片 有能力在會(huì)議和視頻通話中提供協(xié)助 發(fā)布會(huì)為其潛在影響提供了清晰的愿景。隨著企業(yè)駕馭不斷變化的技術(shù)領(lǐng)域,擁抱ChatGPT-4o對(duì)于實(shí)現(xiàn)持續(xù)增長(zhǎng)和創(chuàng)新至關(guān)重要。
    發(fā)表于 05-27 15:43

    ChatGPT對(duì)話語(yǔ)音識(shí)別

    ChatGPT
    YS YYDS
    發(fā)布于 :2023年05月30日 22:13:10

    科技大廠競(jìng)逐AIGC,中國(guó)的ChatGPT在哪?

    。 圖源:OpenAI官網(wǎng) 中國(guó)AI水平與ChatGPT有多大的差距?中國(guó)如何訓(xùn)練出這樣的GPT大模型?難點(diǎn)又在哪里? ChatGPT是AIGC的一種實(shí)現(xiàn)。在AIGC的大模型建設(shè)和應(yīng)用層面,國(guó)內(nèi)
    發(fā)表于 03-03 14:28

    如何讓ChatGPT實(shí)現(xiàn)MIMO波束賦形

    不一定。很多它并不了解的知識(shí),ChatGPT會(huì)拼湊出看似合理的答案,對(duì)初學(xué)者要引起充分的警惕。比如我問(wèn)它某個(gè)西北菜怎么烹飪,它回答的頭頭是道、步驟清晰、邏輯性好,但做的方法并不對(duì)
    的頭像 發(fā)表于 02-03 16:41 ?820次閱讀

    ChatGPT了的七個(gè)開(kāi)源項(xiàng)目

    就推出了很多。估計(jì),現(xiàn)在還有不少同學(xué)苦于不知道該如何體驗(yàn)chatGPT。   chatGPT火了,圍繞chatGPT盡心二次擴(kuò)展的開(kāi)源項(xiàng)目最近也涌現(xiàn)出很多,今天就來(lái)給大家介紹幾個(gè)最近發(fā)現(xiàn)的不錯(cuò)的開(kāi)源項(xiàng)目!   這是一
    發(fā)表于 02-15 09:26 ?3次下載
    <b class='flag-5'>ChatGPT</b>了的七個(gè)開(kāi)源項(xiàng)目

    如何讓ChatGPT實(shí)現(xiàn)MIMO波束賦形和寫一封會(huì)議邀請(qǐng)信?

    ChatGPT的對(duì)話過(guò)程中,必須寫出便于理解、消除歧義的Prompts(提示,即你的指令或問(wèn)題),它才可以理解你的意思,做出正確的應(yīng)答。下面我們用兩個(gè)例子,向大家展示好的Prompts會(huì)讓它變得有多強(qiáng)。
    的頭像 發(fā)表于 02-22 09:59 ?570次閱讀

    微軟發(fā)布Visual ChatGPT:視覺(jué)模型加持ChatGPT實(shí)現(xiàn)絲滑聊天

    系統(tǒng)原則的提示符,“Visual ChatGPT是一個(gè)可以處理廣泛語(yǔ)言和視覺(jué)任務(wù)的助手,xxxxxx”。在這個(gè)prompt的部分,以下內(nèi)容被強(qiáng)調(diào):Visual ChatGPT的角色,可以訪問(wèn)且需要
    的頭像 發(fā)表于 03-16 10:35 ?1313次閱讀

    基于ChatGPT實(shí)現(xiàn)微信機(jī)器人

    掃碼登錄過(guò)后,就能像開(kāi)頭文中截圖那樣跟機(jī)器人聊天啦。不過(guò)你要注意,我們的賬戶里只有5美元體驗(yàn)金,而這個(gè)API 的調(diào)用是要消耗金錢的,所以大家用來(lái)自己玩玩,體驗(yàn)體驗(yàn)就好,不然一會(huì)兒把體驗(yàn)金耗完就沒(méi)得玩了。Wechatbot 的項(xiàng)目地址在這里https://github.com/qingconglaixueit/wechatbot,感興趣的也可以去研究研究。
    的頭像 發(fā)表于 03-30 10:34 ?2409次閱讀

    人工智能技術(shù)的風(fēng)險(xiǎn)與應(yīng)對(duì)措施

    進(jìn)入智能化、信息化時(shí)代,以人工智能技術(shù)為基礎(chǔ)的新一代信息科技不斷向認(rèn)知智能階段邁進(jìn),特別是2022年11月美國(guó)人工智能Open AI公司研究發(fā)布的聊天機(jī)器人程序ChatGPT,實(shí)現(xiàn)了人工智能從感知
    發(fā)表于 08-04 11:34 ?1263次閱讀

    人工智能技術(shù)的風(fēng)險(xiǎn)與應(yīng)對(duì)措施

    進(jìn)入智能化、信息化時(shí)代,以人工智能技術(shù)為基礎(chǔ)的新一代信息科技不斷向認(rèn)知智能階段邁進(jìn),特別是2022年11月美國(guó)人工智能OpenAI公司研究發(fā)布的聊天機(jī)器人程序ChatGPT實(shí)現(xiàn)了人工智能從感知理解
    的頭像 發(fā)表于 08-06 08:09 ?2004次閱讀
    人工智能技術(shù)的風(fēng)險(xiǎn)與應(yīng)對(duì)措施

    ChatGPT是怎么實(shí)現(xiàn)

    ChatGPT 能夠自動(dòng)生成類似于人類寫作的文本,這一點(diǎn)非常引人注目,也令人意外。但它是如何實(shí)現(xiàn)的?為什么它能夠如此出色地生成我們認(rèn)為有意義的文本?我的目的是在這里概述ChatGPT內(nèi)部的運(yùn)行
    的頭像 發(fā)表于 10-16 11:31 ?846次閱讀
    <b class='flag-5'>ChatGPT</b>是怎么<b class='flag-5'>實(shí)現(xiàn)</b>的