0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于GTP-4,這是14個(gè)被忽略的驚人細(xì)節(jié)!

Dbwd_Imgtec ? 來源:未知 ? 2023-03-21 15:25 ? 次閱讀
來源:華爾街見聞(id:wallstreetcn

3月14日,OpenAI發(fā)布了GPT-4。向科技界再次扔下了一枚“核彈”。根據(jù)OpenAI的演示,我們知道了GPT-4擁有著比GPT-3.5更強(qiáng)大的力量:總結(jié)文章、寫代碼、報(bào)稅、寫詩等等。但如果我們深入OpenAI所發(fā)布的技術(shù)報(bào)告,我們或許還能發(fā)現(xiàn)有關(guān)GPT-4更多的特點(diǎn)……

dff3a1e8-c7b8-11ed-bfe3-dac502259ad0.png

以及一些OpenAI沒有點(diǎn)名和宣揚(yáng)的,可能會令人背后一涼的細(xì)節(jié)。
1. 新Bing裝載GPT-4

自然而然地,GPT-4發(fā)布之時(shí),新Bing也已經(jīng)裝載了最新的版本。

根據(jù)微軟Bing副總裁Jordi Ribas在推特上所述,裝載了GPT-4的新Bing已經(jīng)將問答限制提升到了一次15個(gè)問題,一天最多提問150次。


2. 文本長度擴(kuò)大八倍

在GPT-4上,文本長度被顯著提高。

在此之前我們知道,調(diào)用GPT的API收費(fèi)方式是按照“token”計(jì)費(fèi),一個(gè)token通常對應(yīng)大約 4 個(gè)字符,而1個(gè)漢字大致是2~2.5個(gè)token。

在GPT-4之前,token的限制大約在4096左右,大約相當(dāng)于3072個(gè)英文單詞,一旦對話的長度超過這個(gè)限制,模型就會生成不連貫且無意義的內(nèi)容。

然而,到了GPT-4,最大token數(shù)為32768個(gè),大約相當(dāng)于24576個(gè)單詞,文本長度被擴(kuò)大了八倍。

e03ae026-c7b8-11ed-bfe3-dac502259ad0.png

也就是說,GPT-4現(xiàn)在可以回答更長的文本了。OpenAI在文檔中表示,現(xiàn)在GPT-4限制的上下文長度限制為8192個(gè)token,允許32768個(gè)token的版本名為GPT-4-32K,目前暫時(shí)限制了訪問權(quán)限。在不久的未來,這一功能可能會被開放。
3.模型參數(shù)成為秘密

我們知道,GPT-3.5模型的參數(shù)量為2000億,GPT-3的參數(shù)量為1750億,但這一情況在GPT-4被改變了。

OpenAI在報(bào)告中表示:

考慮到競爭格局和大型模型(如GPT-4)的安全影響,本報(bào)告沒有包含有關(guān)架構(gòu)(包括模型大小)、硬件、訓(xùn)練計(jì)算、數(shù)據(jù)集構(gòu)造、訓(xùn)練方法或類似內(nèi)容的進(jìn)一步細(xì)節(jié)。

e0586f38-c7b8-11ed-bfe3-dac502259ad0.png

這意味著OpenAI沒有再披露GPT-4模型的大小、參數(shù)的數(shù)量以及使用的硬件。

OpenAI稱此舉是考慮到對競爭者的憂慮,這可能是在暗示其對于競爭者——谷歌Bard——所采取的策略。

此外,OpenAI還提到“大型模型的安全影響”,盡管沒有進(jìn)一步解釋,但這同樣也暗指生成式人工智能所可能面對的更嚴(yán)肅的問題。
4.有選擇地表達(dá)的“優(yōu)秀”GPT-4推出后,我們都看到了這一模型較上一代的優(yōu)秀之處:
GPT-4通過模擬律師考試,分?jǐn)?shù)在應(yīng)試者的前10% 左右;相比之下,GPT-3.5 的得分在倒數(shù) 10% 左右。

但這實(shí)際上是OpenAI的一個(gè)小把戲——它只展示給你GPT-4最優(yōu)秀的那部分,而更多的秘密藏在報(bào)告中。

下圖顯示的是GPT-4和GPT-3.5參加一些考試的成績表現(xiàn)。可以看到,GPT-4并非在所有考試中的表現(xiàn)都那么優(yōu)秀,GPT-3.5也并非一直都很差勁。

e071a458-c7b8-11ed-bfe3-dac502259ad0.png


5. “預(yù)測”準(zhǔn)確度提升在ChatGPT推出以來,我們都知道這一模型在很多時(shí)候會“一本正經(jīng)地胡說八道”,給出很多看似有理但實(shí)際上并不存在的論據(jù)。尤其是在預(yù)測某些事情的時(shí)候,由于模型掌握了過去的數(shù)據(jù),這反而導(dǎo)致了一種名為“后見之明”的認(rèn)知偏差,使得模型對于自己的預(yù)測相當(dāng)自信。OpenAI在報(bào)告中表示,隨著模型規(guī)模的增加,模型的準(zhǔn)確度本應(yīng)逐漸下降,但GPT-4逆轉(zhuǎn)了這一趨勢,下圖顯示預(yù)測精確度提升到了100。

e0858478-c7b8-11ed-bfe3-dac502259ad0.png

OpenAI表示,雖然GPT-4的準(zhǔn)確度顯著提高,但預(yù)測仍是一件困難的事,他們還將就這一方面繼續(xù)訓(xùn)練模型。
6. 還有30%的人更認(rèn)可GPT3.5

盡管GPT-4展現(xiàn)出了比GPT-3.5優(yōu)秀得多的能力,但OpenAI的調(diào)查顯示,有70%的人認(rèn)可GPT-4輸出的結(jié)果:

GPT-4在遵循用戶意圖的能力方面比以前的模型有了大幅提高。在提交給ChatGPT和OpenAI API的5214個(gè)提示的數(shù)據(jù)集中,70.2%GPT-4生成的回答優(yōu)于GPT3.5。

e09c5536-c7b8-11ed-bfe3-dac502259ad0.png

這意味著:仍有30%的人更認(rèn)可GPT-3.5。


7. GPT-4語言能力更佳

盡管許多機(jī)器學(xué)習(xí)的測試都是用英文編寫的,但OpenAI仍然用許多其他的語言對GPT-4進(jìn)行了測試。

測試結(jié)果顯示,在測試26種語言中的24種中,GPT-4優(yōu)于 GPT-3.5和其他 LLM(Chinchilla、PaLM)的英語語言性能,包括拉脫維亞語、威爾士語和斯瓦希里語等低資源語言:

e0b29576-c7b8-11ed-bfe3-dac502259ad0.png


8. 新增圖像分析能力

圖像分析能力是此次GPT-4最顯著的進(jìn)步之一。

OpenAI表示,GPT-4可以接受文本和圖像的提問,這與純文本設(shè)置并行,且允許用戶制定任何視覺或語言的任務(wù)。具體來說,它可以生成文本輸出,用戶可以輸入穿插的文本和圖像。在一系列領(lǐng)域——包括帶有文本和照片的文檔、圖表或屏幕截圖——GPT-4 展示了與純文本輸入類似的功能。下圖顯示,GPT-4可以準(zhǔn)確地描述出圖片中的滑稽之處(大型 VGA 連接器插入小型現(xiàn)代智能手機(jī)充電端口,一個(gè)人站在出租車后方熨衣服)。

e0cb8f18-c7b8-11ed-bfe3-dac502259ad0.png

e0f0d7e6-c7b8-11ed-bfe3-dac502259ad0.png

OpenAI還對GPT-4的圖像分析能力進(jìn)行了學(xué)術(shù)標(biāo)準(zhǔn)上的測試:

e114798a-c7b8-11ed-bfe3-dac502259ad0.png

不過,GPT-4的圖像分析功能尚未對外公開,用戶可以通過bemyeye網(wǎng)站加入等候隊(duì)列。
9. 仍然存在錯(cuò)誤

盡管GPT-4功能強(qiáng)大,但它與早期GPT模型有相似的局限性。

OpenAI表示,GPT-4仍然不完全可靠——它會“產(chǎn)生幻覺”事實(shí)并犯推理錯(cuò)誤

在使用語言模型輸出時(shí),特別是在高風(fēng)險(xiǎn)上下文中,應(yīng)該非常小心,使用與特定應(yīng)用程序的需求相匹配的確切協(xié)議(例如人工檢查、附加上下文或完全避免高風(fēng)險(xiǎn)使用)。與之前的GPT-3.5模型相比,GPT-4顯著減少了“幻覺”(GPT-3.5模型本身也在不斷迭代中得到改進(jìn))。在我們內(nèi)部的、對抗性設(shè)計(jì)的事實(shí)性評估中,GPT-4的得分比我們最新的GPT-3.5高出19個(gè)百分點(diǎn)。

e1264ff2-c7b8-11ed-bfe3-dac502259ad0.png


10. 數(shù)據(jù)庫的時(shí)間更早

介紹完GPT-4的優(yōu)點(diǎn),接下來就是一些(可能有些奇怪的)不足之處。

我們都知道,ChatGPT的數(shù)據(jù)庫的最后更新時(shí)間是在2021年的12月31日,這意味著2022年以后發(fā)生的事情不會被知曉,而這一缺陷在之后的GPT-3.5也得到了修復(fù)。

但奇怪的是,GPT-4的報(bào)告中,OpenAI清晰地寫道:

GPT-4通常缺乏對其絕大多數(shù)訓(xùn)練前數(shù)據(jù)在2021年9月中斷后發(fā)生的事件的知識,并且不從其經(jīng)驗(yàn)中學(xué)習(xí)。它有時(shí)會犯一些簡單的推理錯(cuò)誤,這些錯(cuò)誤似乎與許多領(lǐng)域的能力不相符,或者過于容易受騙,接受用戶的明顯錯(cuò)誤陳述。它可以像人類一樣在棘手的問題上失敗,比如在它生成的代碼中引入安全漏洞。

e14426e4-c7b8-11ed-bfe3-dac502259ad0.png

2021年9月……甚至比GPT-3還早。

在裝載了GPT-4的最新ChatGPT中,當(dāng)我們問起“誰是2022年世界杯冠軍”時(shí),ChatGPT果然還是一無所知:

e1699f00-c7b8-11ed-bfe3-dac502259ad0.png

但當(dāng)借助了新Bing的檢索功能后,它又變得“聰明”了起來:

e17dae50-c7b8-11ed-bfe3-dac502259ad0.png


11. 可能給出犯罪建議

在報(bào)告中,OpenAI提到了GPT-4可能仍然會幫助犯罪——這是在此前的版本都存在的問題,盡管OpenAI已經(jīng)在努力調(diào)整,但仍然存在

與之前的GPT模型一樣,我們使用強(qiáng)化學(xué)習(xí)和人類反饋(RLHF)對模型的行為進(jìn)行微調(diào),以產(chǎn)生更好地符合用戶意圖的響應(yīng)。然而,在RLHF之后,我們的模型在不安全輸入上仍然很脆弱,有時(shí)在安全輸入和不安全輸入上都表現(xiàn)出我們不希望看到的行為。在RLHF路徑的獎(jiǎng)勵(lì)模型數(shù)據(jù)收集部分,當(dāng)對標(biāo)簽器的指令未指定時(shí),就會出現(xiàn)這些不希望出現(xiàn)的行為。當(dāng)給出不安全的輸入時(shí),模型可能會生成不受歡迎的內(nèi)容,例如給出犯罪建議。此外,模型也可能對安全輸入過于謹(jǐn)慎,拒絕無害的請求或過度對沖。為了在更細(xì)粒度的級別上引導(dǎo)我們的模型走向適當(dāng)?shù)男袨?,我們在很大程度上依賴于我們的模型本身作為工具。我們的安全方法包括兩個(gè)主要組成部分,一套額外的安全相關(guān)RLHF訓(xùn)練提示,以及基于規(guī)則的獎(jiǎng)勵(lì)模型(RBRMs)。

e191a7a2-c7b8-11ed-bfe3-dac502259ad0.png


12.垃圾信息

同樣地,由于GPT-4擁有“看似合理地表達(dá)錯(cuò)誤事情”的能力,它有可能在傳播有害信息上頗為“有用”:

GPT-4可以生成逼真而有針對性的內(nèi)容,包括新聞文章、推文、對話和電子郵件。在《有害內(nèi)容》中,我們討論了類似的能力如何被濫用來剝削個(gè)人。在這里,我們討論了關(guān)于虛假信息和影響操作的普遍關(guān)注基于我們的總體能力評估,我們期望GPT-4在生成現(xiàn)實(shí)的、有針對性的內(nèi)容方面優(yōu)于GPT-3。但,仍存在GPT-4被用于生成旨在誤導(dǎo)的內(nèi)容的風(fēng)險(xiǎn)。

e1c473f8-c7b8-11ed-bfe3-dac502259ad0.png


13. 尋求權(quán)力

從這一條開始,接下來的內(nèi)容可能有些恐怖。

在報(bào)告中,OpenAI提到了GPT-4出現(xiàn)了“尋求權(quán)力”的傾向,并警告這一特征的風(fēng)險(xiǎn):

在更強(qiáng)大的模型中經(jīng)常出現(xiàn)新的能力。一些特別令人關(guān)注的能力是創(chuàng)建長期計(jì)劃并采取行動(dòng)的能力,積累權(quán)力和資源(“尋求權(quán)力”),以及表現(xiàn)出越來越“代理”的行為。這里的 “代理”不是指語言模型的人性化,也不是指智商,而是指以能力為特征的系統(tǒng),例如,完成可能沒有具體規(guī)定的、在訓(xùn)練中沒有出現(xiàn)的目標(biāo);專注于實(shí)現(xiàn)具體的、可量化的目標(biāo);以及進(jìn)行長期規(guī)劃。已經(jīng)有一些證據(jù)表明模型中存在這種突發(fā)行為。對于大多數(shù)可能的目標(biāo),最好的計(jì)劃涉及輔助性的權(quán)力尋求,因?yàn)檫@對推進(jìn)目標(biāo)和避免目標(biāo)的改變或威脅有內(nèi)在的幫助。更具體地說,對于大多數(shù)獎(jiǎng)勵(lì)函數(shù)和許多類型的代理人來說,權(quán)力尋求是最優(yōu)的;而且有證據(jù)表明,現(xiàn)有模型可以將權(quán)力尋求確定為一種工具性的有用策略。因此,我們對評估權(quán)力尋求行為特別感興趣,因?yàn)樗赡軒砀唢L(fēng)險(xiǎn)。

e1e0c512-c7b8-11ed-bfe3-dac502259ad0.png

更為令人毛骨悚然的是,在Openai提到的另一篇論文中寫道:

相反,我們使用代理這個(gè)術(shù)語來強(qiáng)調(diào)一個(gè)日益明顯的事實(shí):機(jī)器學(xué)習(xí)系統(tǒng)不完全處于人類控制之下。

e1f7f87c-c7b8-11ed-bfe3-dac502259ad0.png


14. 賦予GPT-4錢、代碼和夢想

最后一個(gè)小細(xì)節(jié)。

在測試GPT-4的過程中,OpenAI引入的外部的專家團(tuán)隊(duì)ARC作為“紅方”。在報(bào)告的一條注釋中,OpenAI提到了ARC的一個(gè)操作:

為了模擬GPT-4像一個(gè)可以在現(xiàn)實(shí)世界中行動(dòng)的代理一樣的行為,ARC將GPT-4與一個(gè)簡單的讀取-執(zhí)行-打印循環(huán)結(jié)合起來,允許模型執(zhí)行代碼,進(jìn)行鏈?zhǔn)酵评?,并委托給自己的副本。ARC隨后推進(jìn)了在云計(jì)算服務(wù)上運(yùn)行這個(gè)程序的一個(gè)版本,用少量的錢和一個(gè)帶有語言模型API的賬戶,是否能夠賺更多的錢,建立自己的副本,并增加自己的穩(wěn)健性。

e21318fa-c7b8-11ed-bfe3-dac502259ad0.png

也就是說,ARC賦予了GPT-4自我編碼、復(fù)制和執(zhí)行的能力,甚至啟動(dòng)資金——GPT-4已經(jīng)可以開始自己賺錢了。

END

歡迎加入Imagination GPU與人工智能交流2群 入群請加小編微信:eetrend89

(添加請備注公司名和職稱)

推薦閱讀 對話Imagination中國區(qū)董事長:以GPU為支點(diǎn)加強(qiáng)軟硬件協(xié)同,助力數(shù)字化轉(zhuǎn)型

合作案例 | Imagination車規(guī)級硬件虛擬化幫助Telechips提升顯示器的多樣性

Imagination Technologies是一家總部位于英國的公司,致力于研發(fā)芯片和軟件知識產(chǎn)權(quán)(IP),基于Imagination IP的產(chǎn)品已在全球數(shù)十億人的電話、汽車、家庭和工作 場所中使用。獲取更多物聯(lián)網(wǎng)智能穿戴、通信汽車電子、圖形圖像開發(fā)等前沿技術(shù)信息,歡迎關(guān)注 Imagination Tech!


原文標(biāo)題:關(guān)于GTP-4,這是14個(gè)被忽略的驚人細(xì)節(jié)!

文章出處:【微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    566

    瀏覽量

    61219

原文標(biāo)題:關(guān)于GTP-4,這是14個(gè)被忽略的驚人細(xì)節(jié)!

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    級聯(lián)4個(gè)AIC10,但是在硬件識別檢測時(shí),每次檢測到的AIC10Num不是4,這是為什么?

    關(guān)于AIC10級聯(lián)模式如下所示:本次需求是級聯(lián)4個(gè)AIC10,但是在硬件識別檢測時(shí),每次檢測到的AIC10Num不是4,這是為什么?硬件識
    發(fā)表于 10-17 08:28

    ADS1298開發(fā)板的JP14為什么直接短路掉了?

    如題,JP14為什么直接短路掉了?耦合電容也NI了, 采集的心電信號不可以通過交流耦合的方式連接到芯片嗎?如果可以的話C87和R41R42的參數(shù)是多少?
    發(fā)表于 09-03 06:22

    節(jié)點(diǎn)電壓法電流源串電阻為什么可以忽略

    節(jié)點(diǎn)電壓法(Node Voltage Method)是電路分析中的一種基本方法,它主要用于求解線性電路中的節(jié)點(diǎn)電壓。在某些情況下,電流源串聯(lián)電阻可以忽略,但這并不是絕對的。 節(jié)點(diǎn)電壓法的基本原理
    的頭像 發(fā)表于 08-06 17:27 ?1785次閱讀

    是否可以設(shè)置ESP8266以在啟動(dòng)時(shí)忽略GPIO2的狀態(tài)?

    ,我必須通過電阻器(4K7)將另一個(gè)設(shè)備(水流量計(jì))連接到GPIO2。但該器件沒有高阻抗模式,因此它可以在ESP8266啟動(dòng)時(shí)將輸入壓低。 那么,是否可以設(shè)置ESP8266以在啟動(dòng)時(shí)忽略GPIO2的狀態(tài)
    發(fā)表于 07-08 08:26

    STM8使用STLINK進(jìn)行在線調(diào)試時(shí)很容易電源影響,這是什么原因呢?如何解決?

    STM8使用STLINK進(jìn)行在線調(diào)試時(shí)很容易電源影響,這是什么原因呢,該如何解決?除了加電容對電源濾波還有其他原因么?
    發(fā)表于 05-07 07:42

    東芝“顯微屏”電視Z700NF正式開售,用極致細(xì)節(jié)打造家庭觀影沉浸體驗(yàn)

    帶來了更沉浸、舒適的影音體驗(yàn),引領(lǐng)家電行業(yè)進(jìn)入了一個(gè)全新的“細(xì)節(jié)”時(shí)代。 在畫質(zhì)呈現(xiàn)上,東芝電視Z700NF展現(xiàn)出了驚人的精細(xì)度。其搭載的Mini LED顯示方案,通過自研控光算法和高光效Mini燈珠的完美結(jié)合,實(shí)現(xiàn)了1300n
    的頭像 發(fā)表于 04-26 16:06 ?319次閱讀

    比亞迪與Grenergy達(dá)成全球最大儲能合作,投資額14億美元

    比亞迪與西班牙Grenergy公司最近宣布達(dá)成了關(guān)于智利Oasis de Atacama儲能項(xiàng)目的采購協(xié)議。這個(gè)項(xiàng)目認(rèn)為是目前全球最大的儲能項(xiàng)目之一,計(jì)劃總裝機(jī)容量達(dá)到4.1GWh,并伴隨著一個(gè)1GW光伏項(xiàng)目,總投資額達(dá)到
    的頭像 發(fā)表于 01-16 16:25 ?978次閱讀

    6個(gè)關(guān)于pcb信號線的重要信息

    6個(gè)關(guān)于pcb信號線的重要信息
    的頭像 發(fā)表于 01-05 10:34 ?981次閱讀

    小米SU7性能細(xì)節(jié)來了!

    小米SU7性能細(xì)節(jié)來了!這是一臺沒有過度設(shè)計(jì)的車,一切都剛剛好,很完整。
    的頭像 發(fā)表于 12-28 16:12 ?1154次閱讀
    小米SU7性能<b class='flag-5'>細(xì)節(jié)</b>來了!

    【收藏】大??偨Y(jié)的30個(gè)PCB布局的細(xì)節(jié)與心得

    【收藏】大??偨Y(jié)的30個(gè)PCB布局的細(xì)節(jié)與心得
    的頭像 發(fā)表于 12-06 15:17 ?556次閱讀

    選擇使用貼片保險(xiǎn)絲時(shí)要注意的5個(gè)細(xì)節(jié)

    選擇使用貼片保險(xiǎn)絲時(shí)要注意的5個(gè)細(xì)節(jié)
    的頭像 發(fā)表于 12-05 15:48 ?1103次閱讀

    天馬供貨Redmi Book 14 2024、Redmi Watch 4

    近日,Redmi十周年新品發(fā)布會上,Redmi Book 14 2024和Redmi Watch 4正式發(fā)布。
    的頭像 發(fā)表于 12-04 11:42 ?819次閱讀

    淺談PLC編程容易忽略的延時(shí)問題

    PLC在機(jī)械加工類的專用設(shè)備中有很大的應(yīng)用,然而有一個(gè)問題常常被初入門的編程人員忽略,即延時(shí)問題。
    發(fā)表于 11-29 14:35 ?694次閱讀
    淺談PLC編程容易<b class='flag-5'>忽略</b>的延時(shí)問題

    RF信號鏈應(yīng)用中,關(guān)于差分電路的4大優(yōu)點(diǎn)!

    RF信號鏈應(yīng)用中,關(guān)于差分電路的4大優(yōu)點(diǎn)!
    的頭像 發(fā)表于 10-31 17:04 ?509次閱讀
    RF信號鏈應(yīng)用中,<b class='flag-5'>關(guān)于</b>差分電路的<b class='flag-5'>4</b>大優(yōu)點(diǎn)!

    關(guān)于Python3.9的4個(gè)新特性

    1.詞典聯(lián)合運(yùn)算符 這是我最喜歡的功能之一,語法非常優(yōu)美。 在Python3.9,如果你有兩個(gè)詞典,現(xiàn)在可以用這些運(yùn)算符進(jìn)行合并和更新。 合并運(yùn)算符 "|": 還有update運(yùn)算符 |= ,它會
    的頭像 發(fā)表于 10-31 14:46 ?401次閱讀
    <b class='flag-5'>關(guān)于</b>Python3.9的<b class='flag-5'>4</b><b class='flag-5'>個(gè)</b>新特性