中國(guó)版ChatGPT下月面世
美國(guó)人工智能公司OpenAI的大語(yǔ)言模型ChatGPT在推出約兩個(gè)月后,1月已達(dá)到1億月活躍用戶(hù),成為歷史上增長(zhǎng)最快的消費(fèi)者應(yīng)用程序,更是掀起了新一輪人工智能浪潮。
北京時(shí)間2月8日凌晨,微軟推出由ChatGPT支持的最新版本必應(yīng)搜索引擎和Edge瀏覽器,宣布要“重塑搜索”。微軟旗下Office、Azure云服務(wù)等所有產(chǎn)品都將全線(xiàn)整合ChatGPT。
更有甚者,中國(guó)百度公司2月7日表示,將在今年3月完成類(lèi)似ChatGPT的項(xiàng)目“文心一言”(ERNIE Bot)的內(nèi)部測(cè)試,加入這場(chǎng)全球競(jìng)賽。
百度公司表示,文心一言(其英文名Ernie為“通過(guò)知識(shí)整合增強(qiáng)表征”的英文縮寫(xiě))是一種大型人工智能賦能的語(yǔ)言模式,于2019年啟動(dòng)。該公司還說(shuō),它已經(jīng)逐漸發(fā)展到能夠完成語(yǔ)言理解、語(yǔ)言生成和文本生成圖像等任務(wù)。
百度稱(chēng),該公司在人工智能四層架構(gòu)中擁有全棧布局?!拔男囊谎浴蔽挥谀P蛯??;诠驹谌斯ぶ悄茴I(lǐng)域深耕數(shù)十年,擁有產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE,具備跨模態(tài)、跨語(yǔ)言的深度語(yǔ)義理解與生成能力。
如何訓(xùn)練ChatGPT
ChatGPT現(xiàn)在支持GPT-3.5系列機(jī)型,比 GPT3更強(qiáng)大。 這些模型在 Microsoft 的Azure AI超級(jí)計(jì)算基礎(chǔ)設(shè)施上使用文本和代碼數(shù)據(jù)進(jìn)行訓(xùn)練。
具體來(lái)說(shuō),ChatGPT是在開(kāi)源數(shù)據(jù)集上訓(xùn)練的,訓(xùn)練參數(shù)比上一代GPT3提升了10倍以上,并且人工標(biāo)注數(shù)據(jù)和強(qiáng)化學(xué)習(xí),相當(dāng)于拿回了被GPT3去掉的微調(diào)步驟,實(shí)現(xiàn)了在與人類(lèi)互動(dòng)時(shí)從反饋中強(qiáng)化學(xué)習(xí)。
當(dāng)我們想要構(gòu)建一個(gè)AI模型時(shí),最重要的步驟總結(jié)下來(lái)就是:定義架構(gòu)、訓(xùn)練、調(diào)試以及測(cè)試。記者詢(xún)問(wèn)ChatGPT,你是如何訓(xùn)練的,它的回復(fù)是:1. 選擇大規(guī)模語(yǔ)料庫(kù),構(gòu)建訓(xùn)練集。2. 定義模型架構(gòu),通常使用Transformer模型。3. 選擇優(yōu)化算法并設(shè)置超參數(shù)。4. 訓(xùn)練模型,根據(jù)訓(xùn)練損失下降情況和驗(yàn)證集結(jié)果決定是否需要調(diào)整超參數(shù)。5. 使用測(cè)試集評(píng)估模型性能。6. 如果需要,對(duì)模型進(jìn)行微調(diào),以提高性能。
當(dāng)決定要訓(xùn)練一個(gè)語(yǔ)言類(lèi)AI模型時(shí),第一件事就要明確訓(xùn)練AI的語(yǔ)料庫(kù)。語(yǔ)料庫(kù)的選擇十分重要,為了讓語(yǔ)言模型學(xué)到足夠多的語(yǔ)言信息,需要選擇盡量規(guī)模大的文本語(yǔ)料庫(kù)。以ChatGPT為例,訓(xùn)練類(lèi)似AI模型時(shí),就需要準(zhǔn)備各類(lèi)網(wǎng)站的百科文章、網(wǎng)絡(luò)回答、專(zhuān)業(yè)論文等。據(jù)了解,一款通用AI算法所使用的預(yù)訓(xùn)練語(yǔ)料庫(kù)大小為1-10GB之間,而用于訓(xùn)練ChatGPT的前身——GPT-3的語(yǔ)料庫(kù)達(dá)到了45TB。
訓(xùn)練AI執(zhí)行語(yǔ)言任務(wù)還繞不開(kāi)Transformer模型。Transformer模型(變換器)是一種采用自注意力機(jī)制的深度學(xué)習(xí)模型,自注意力的意思即可以按照輸入數(shù)據(jù)各部分重要性的不同而分配不同的權(quán)重。它通過(guò)計(jì)算詞與詞之間的相對(duì)位置關(guān)系來(lái)確定注意力的權(quán)值,最終生成語(yǔ)句的語(yǔ)義表示。Transformer的優(yōu)勢(shì)在于其可以并行計(jì)算,速度快,精度高,是目前自然語(yǔ)言處理中最常使用的模型之一。
文章綜合與非網(wǎng)、參考消息網(wǎng)、新華社
-
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
328瀏覽量
12270 -
自然語(yǔ)言
+關(guān)注
關(guān)注
1文章
279瀏覽量
13309 -
ChatGPT
+關(guān)注
關(guān)注
28文章
1523瀏覽量
7247
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論