0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何訓(xùn)練ChatGPT?中國(guó)版ChatGPT下月面世

要長(zhǎng)高 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2023-02-13 15:10 ? 次閱讀

中國(guó)版ChatGPT下月面世

美國(guó)人工智能公司OpenAI的大語(yǔ)言模型ChatGPT在推出約兩個(gè)月后,1月已達(dá)到1億月活躍用戶(hù),成為歷史上增長(zhǎng)最快的消費(fèi)者應(yīng)用程序,更是掀起了新一輪人工智能浪潮。

北京時(shí)間2月8日凌晨,微軟推出由ChatGPT支持的最新版本必應(yīng)搜索引擎和Edge瀏覽器,宣布要“重塑搜索”。微軟旗下Office、Azure云服務(wù)等所有產(chǎn)品都將全線(xiàn)整合ChatGPT。

更有甚者,中國(guó)百度公司2月7日表示,將在今年3月完成類(lèi)似ChatGPT的項(xiàng)目“文心一言”(ERNIE Bot)的內(nèi)部測(cè)試,加入這場(chǎng)全球競(jìng)賽。

百度公司表示,文心一言(其英文名Ernie為“通過(guò)知識(shí)整合增強(qiáng)表征”的英文縮寫(xiě))是一種大型人工智能賦能的語(yǔ)言模式,于2019年啟動(dòng)。該公司還說(shuō),它已經(jīng)逐漸發(fā)展到能夠完成語(yǔ)言理解、語(yǔ)言生成和文本生成圖像等任務(wù)。

百度稱(chēng),該公司在人工智能四層架構(gòu)中擁有全棧布局?!拔男囊谎浴蔽挥谀P蛯??;诠驹谌斯ぶ悄茴I(lǐng)域深耕數(shù)十年,擁有產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE,具備跨模態(tài)、跨語(yǔ)言的深度語(yǔ)義理解與生成能力。

如何訓(xùn)練ChatGPT

ChatGPT現(xiàn)在支持GPT-3.5系列機(jī)型,比 GPT3更強(qiáng)大。 這些模型在 Microsoft 的Azure AI超級(jí)計(jì)算基礎(chǔ)設(shè)施上使用文本和代碼數(shù)據(jù)進(jìn)行訓(xùn)練。

具體來(lái)說(shuō),ChatGPT是在開(kāi)源數(shù)據(jù)集上訓(xùn)練的,訓(xùn)練參數(shù)比上一代GPT3提升了10倍以上,并且人工標(biāo)注數(shù)據(jù)和強(qiáng)化學(xué)習(xí),相當(dāng)于拿回了被GPT3去掉的微調(diào)步驟,實(shí)現(xiàn)了在與人類(lèi)互動(dòng)時(shí)從反饋中強(qiáng)化學(xué)習(xí)。

當(dāng)我們想要構(gòu)建一個(gè)AI模型時(shí),最重要的步驟總結(jié)下來(lái)就是:定義架構(gòu)、訓(xùn)練、調(diào)試以及測(cè)試。記者詢(xún)問(wèn)ChatGPT,你是如何訓(xùn)練的,它的回復(fù)是:1. 選擇大規(guī)模語(yǔ)料庫(kù),構(gòu)建訓(xùn)練集。2. 定義模型架構(gòu),通常使用Transformer模型。3. 選擇優(yōu)化算法并設(shè)置超參數(shù)。4. 訓(xùn)練模型,根據(jù)訓(xùn)練損失下降情況和驗(yàn)證集結(jié)果決定是否需要調(diào)整超參數(shù)。5. 使用測(cè)試集評(píng)估模型性能。6. 如果需要,對(duì)模型進(jìn)行微調(diào),以提高性能。

poYBAGPjYwCAPrJzAAI6iuebZAA738.png

當(dāng)決定要訓(xùn)練一個(gè)語(yǔ)言類(lèi)AI模型時(shí),第一件事就要明確訓(xùn)練AI的語(yǔ)料庫(kù)。語(yǔ)料庫(kù)的選擇十分重要,為了讓語(yǔ)言模型學(xué)到足夠多的語(yǔ)言信息,需要選擇盡量規(guī)模大的文本語(yǔ)料庫(kù)。以ChatGPT為例,訓(xùn)練類(lèi)似AI模型時(shí),就需要準(zhǔn)備各類(lèi)網(wǎng)站的百科文章、網(wǎng)絡(luò)回答、專(zhuān)業(yè)論文等。據(jù)了解,一款通用AI算法所使用的預(yù)訓(xùn)練語(yǔ)料庫(kù)大小為1-10GB之間,而用于訓(xùn)練ChatGPT的前身——GPT-3的語(yǔ)料庫(kù)達(dá)到了45TB。

訓(xùn)練AI執(zhí)行語(yǔ)言任務(wù)還繞不開(kāi)Transformer模型。Transformer模型(變換器)是一種采用自注意力機(jī)制的深度學(xué)習(xí)模型,自注意力的意思即可以按照輸入數(shù)據(jù)各部分重要性的不同而分配不同的權(quán)重。它通過(guò)計(jì)算詞與詞之間的相對(duì)位置關(guān)系來(lái)確定注意力的權(quán)值,最終生成語(yǔ)句的語(yǔ)義表示。Transformer的優(yōu)勢(shì)在于其可以并行計(jì)算,速度快,精度高,是目前自然語(yǔ)言處理中最常使用的模型之一。

文章綜合與非網(wǎng)、參考消息網(wǎng)、新華社

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 聊天機(jī)器人
    +關(guān)注

    關(guān)注

    0

    文章

    328

    瀏覽量

    12270
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    279

    瀏覽量

    13309
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1523

    瀏覽量

    7247
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    llm模型和chatGPT的區(qū)別

    基于Transformer架構(gòu)的預(yù)訓(xùn)練語(yǔ)言模型,它可以生成連貫、自然的文本。ChatGPT使用GPT模型作為基礎(chǔ),通過(guò)微調(diào)和訓(xùn)練來(lái)實(shí)現(xiàn)對(duì)話(huà)生成和理解。 以下是一
    的頭像 發(fā)表于 07-09 09:55 ?687次閱讀

    用launch pad燒錄chatgpt_demo項(xiàng)目會(huì)有api key報(bào)錯(cuò)的原因?

    我用launch pad燒錄chatgpt_demo項(xiàng)目問(wèn)題會(huì)有api key報(bào)錯(cuò);請(qǐng)問(wèn)用launch pad要如何設(shè)置api key和調(diào)試?還是只能通過(guò)idf?
    發(fā)表于 06-27 07:59

    使用espbox lite進(jìn)行chatgpt_demo的燒錄報(bào)錯(cuò)是什么原因?

    我使用espbox lite進(jìn)行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時(shí)似乎沒(méi)有什么問(wèn)題 在燒錄時(shí)報(bào)錯(cuò) 請(qǐng)問(wèn)這是什么原因
    發(fā)表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來(lái)了

    當(dāng)?shù)貢r(shí)間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強(qiáng)大基礎(chǔ)上,這種迭代擁有顯著的改進(jìn)。在發(fā)布會(huì)的演示中,OpenAI展示該模型的高級(jí)
    發(fā)表于 05-27 15:43

    李開(kāi)復(fù):中國(guó)須獨(dú)立研發(fā)ChatGPT?

    李開(kāi)復(fù)援引“ChatGPT 時(shí)刻”概念,指出美國(guó)在約 17 個(gè)月前就已體驗(yàn)到這一波熱潮(注:ChatGPT 最早于 2022 年 12 月走紅)。然而,他認(rèn)為中國(guó)尚未達(dá)到這一階段,目前國(guó)內(nèi)的聊天機(jī)器人或工具仍有待改進(jìn)。
    的頭像 發(fā)表于 05-13 16:05 ?456次閱讀

    探索ChatGPT模型的人工智能語(yǔ)言模型

    最大的區(qū)別ChatGPT是通過(guò)對(duì)話(huà)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,而不僅僅是通過(guò)單一的句子進(jìn)行預(yù)訓(xùn)練,這使得ChatGPT能夠更好地理解對(duì)話(huà)的上下文,并進(jìn)行連貫的回復(fù)。
    發(fā)表于 04-24 10:19 ?614次閱讀
    探索<b class='flag-5'>ChatGPT</b>模型的人工智能語(yǔ)言模型

    在FPGA設(shè)計(jì)中是否可以應(yīng)用ChatGPT生成想要的程序呢

    當(dāng)下AI人工智能崛起,很多開(kāi)發(fā)領(lǐng)域都可看到ChatGPT的身影,F(xiàn)PGA設(shè)計(jì)中,是否也可以用ChatGPT輔助設(shè)計(jì)呢?
    發(fā)表于 03-28 23:41

    【國(guó)產(chǎn)FPGA+OMAPL138開(kāi)發(fā)板體驗(yàn)】(原創(chuàng))6.FPGA連接ChatGPT 4

    OMAP-L138(定點(diǎn)/浮點(diǎn)DSP C674x+ARM9)+ FPGA處理器的開(kāi)發(fā)板。 編寫(xiě)一個(gè)用于FPGA訪(fǎng)問(wèn)ChatGPT 4的程序代碼是一個(gè)相當(dāng)復(fù)雜的任務(wù),涉及到硬件設(shè)計(jì)、網(wǎng)絡(luò)通信、數(shù)據(jù)處理等多個(gè)
    發(fā)表于 02-14 21:58

    ChatGPT原理 ChatGPT模型訓(xùn)練 chatgpt注冊(cè)流程相關(guān)簡(jiǎn)介

    ChatGPT注冊(cè)沒(méi)有外國(guó)手機(jī)號(hào)驗(yàn)證怎么辦? ChatGPT作為近期火爆網(wǎng)絡(luò)的AI項(xiàng)目,受到了前所未有的關(guān)注。我們可以與AI機(jī)器人實(shí)時(shí)聊天,獲得問(wèn)題的答案。但受ChatGPT服務(wù)器及相關(guān)政策
    的頭像 發(fā)表于 12-06 16:28 ?780次閱讀
    <b class='flag-5'>ChatGPT</b>原理 <b class='flag-5'>ChatGPT</b>模型<b class='flag-5'>訓(xùn)練</b> <b class='flag-5'>chatgpt</b>注冊(cè)流程相關(guān)簡(jiǎn)介

    最新ChatGPT詳細(xì)注冊(cè)圖文解說(shuō)教程 ChatGPT賬號(hào)注冊(cè)詳細(xì)步驟分析

    2024年注冊(cè)ChatGPT詳細(xì)教程,手把手教你完成ChatGPT的注冊(cè)
    的頭像 發(fā)表于 12-04 17:18 ?7630次閱讀
    最新<b class='flag-5'>ChatGPT</b>詳細(xì)注冊(cè)圖文解說(shuō)教程  <b class='flag-5'>ChatGPT</b>賬號(hào)注冊(cè)詳細(xì)步驟分析

    不到1分鐘開(kāi)發(fā)一個(gè)GPT應(yīng)用!各路大神瘋狂整活,網(wǎng)友:ChatGPT就是新iPhone

    這個(gè)說(shuō)法并不準(zhǔn)確。盡管ChatGPT等語(yǔ)言模型已經(jīng)在一定程度上改變了我們獲取信息、學(xué)習(xí)知識(shí)的方式,但它們并不能替代人類(lèi)進(jìn)行創(chuàng)造性思考和創(chuàng)造性活動(dòng)。 雖然一些人可能會(huì)利用ChatGPT等語(yǔ)言模型快速
    發(fā)表于 11-19 12:06

    國(guó)內(nèi)企業(yè)用SD-WAN加速訪(fǎng)問(wèn)ChatGPT

    。 1.ChatGPT概述 ChatGPT是一種基于大規(guī)模預(yù)訓(xùn)練技術(shù)的對(duì)話(huà)生成模型。它采用Transformer網(wǎng)絡(luò)架構(gòu),在海量文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,然后通過(guò)fine-tuning進(jìn)行
    的頭像 發(fā)表于 11-15 11:23 ?472次閱讀

    怎么和ChatGPT語(yǔ)音聊天?

    ChatGPT語(yǔ)音聊天免打字輸入、訓(xùn)練外語(yǔ)口說(shuō)能力的好幫手。 ChatGPT手機(jī)App的語(yǔ)音聊天功能是陸續(xù)開(kāi)放給全球Plus用戶(hù),ChatGPT Plus用戶(hù)先確認(rèn)App是否已經(jīng)更新到
    的頭像 發(fā)表于 11-14 17:36 ?3068次閱讀
    怎么和<b class='flag-5'>ChatGPT</b>語(yǔ)音聊天?

    突發(fā) !微軟員工被禁止使用ChatGPT

    許多大公司都限制訪(fǎng)問(wèn)ChatGPT,通常是為了防止員工與其共享機(jī)密數(shù)據(jù)。經(jīng)過(guò)廣泛的互聯(lián)網(wǎng)數(shù)據(jù)訓(xùn)練,ChatGPT可以對(duì)人們的聊天信息做出類(lèi)似真人的回應(yīng)。該服務(wù)擁有超過(guò)1億用戶(hù)。
    的頭像 發(fā)表于 11-10 15:57 ?920次閱讀

    如何使用Rust創(chuàng)建一個(gè)基于ChatGPT的RAG助手

    經(jīng)常會(huì)出現(xiàn)一些幻覺(jué),“一本正經(jīng)”地為我們提供一些錯(cuò)誤答案,沒(méi)有辦法為我們提供專(zhuān)業(yè)的意見(jiàn)或指導(dǎo)。那我們?nèi)绾巫?ChatGPT 具備某個(gè)專(zhuān)業(yè)領(lǐng)域的知識(shí),提升回答的正確率,從而讓 ChatGPT 真的用起來(lái)?比如訓(xùn)練
    的頭像 發(fā)表于 10-24 17:34 ?956次閱讀
    如何使用Rust創(chuàng)建一個(gè)基于<b class='flag-5'>ChatGPT</b>的RAG助手