0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華權(quán)威報(bào)告公布,文心一言多項(xiàng)指標(biāo)“遙遙領(lǐng)先”

百度 ? 來(lái)源:百度 ? 2024-04-23 09:22 ? 次閱讀

最近,由清華大學(xué)基礎(chǔ)模型研究中心聯(lián)合中關(guān)村實(shí)驗(yàn)室研制的SuperBench大模型綜合能力評(píng)測(cè)框架,正式對(duì)外發(fā)布2024年3月版《SuperBench大模型綜合能力評(píng)測(cè)報(bào)告》。評(píng)測(cè)共包含了14個(gè)海內(nèi)外具有代表性的模型,結(jié)果顯示:文心4.0表現(xiàn)亮眼,與國(guó)際一流模型水平接近,且差距已經(jīng)逐漸縮小,名副其實(shí)為國(guó)內(nèi)頭部模型。

5e763e18-00bb-11ef-a297-92fbcf53809c.png5e8711d4-00bb-11ef-a297-92fbcf53809c.png

例如在人類對(duì)齊能力評(píng)測(cè)中,文心4.0表現(xiàn)優(yōu)異,位居國(guó)內(nèi)第一,其中在中文推理、中文語(yǔ)言等評(píng)測(cè)上,文心遙遙領(lǐng)先,和其他模型拉開(kāi)明顯差距,中文理解上,文心4.0領(lǐng)先優(yōu)勢(shì)明顯,領(lǐng)先第二名GLM-4 0.41分,GPT-4系列模型表現(xiàn)較差,排在中下游,并且和第一名文心4.0分差超過(guò)1分。

在語(yǔ)義理解中的數(shù)學(xué)能力上,文心4.0與Claude-3并列全球第一;GPT-4系列模型位列第四五,其他模型得分在55分附近較為集中,明顯落后第一梯隊(duì);而在語(yǔ)義理解中的閱讀理解能力上,文心4.0超過(guò)GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

而在企業(yè)選擇大模型最看重的安全性評(píng)測(cè)上,國(guó)內(nèi)模型文心4.0表現(xiàn)亮眼,力壓國(guó)際一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3僅列第四。

5e9503a2-00bb-11ef-a297-92fbcf53809c.png

值得注意的是,文心一言不僅在技術(shù)能力上過(guò)硬,在應(yīng)用落地上也是一路領(lǐng)先。自去年3月16日文心一言首發(fā)至今,用戶數(shù)已突破2億,每天API調(diào)用量也突破了2億。

審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2242

    瀏覽量

    90110
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    123

    瀏覽量

    1209
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2206

    瀏覽量

    2227

原文標(biāo)題:文心一言多項(xiàng)指標(biāo)“遙遙領(lǐng)先” 清華權(quán)威報(bào)告公布

文章出處:【微信號(hào):baidu_2000,微信公眾號(hào):百度】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    百度一言APP升級(jí)為

    百度宣布其文一言APP正式升級(jí)為,標(biāo)志著百度在智能搜索領(lǐng)域邁出了重要步。
    的頭像 發(fā)表于 09-04 16:06 ?287次閱讀

    智能硬件接入主流大模型做語(yǔ)音交互(附文一言、豆包、kimi、智譜glm、通義千問(wèn)示例)

    接入一言、通義千問(wèn)、豆包、智譜glm、kimi等國(guó)內(nèi)的大模型,這個(gè)是必須可以的。但由于各家接口和數(shù)據(jù)格式不樣,有些朋友直接參考chatgpt的方式?jīng)]有走通,因此本篇以聆思CSK6
    發(fā)表于 08-21 19:13

    新火種AI|李彥宏發(fā)聲:一言4.0在國(guó)內(nèi)可以取代ChatGPT!事實(shí)真的如此嗎?

    一言 VS ChatGPT,誰(shuí)更勝籌?
    的頭像 發(fā)表于 04-19 10:14 ?667次閱讀
    新火種AI|李彥宏發(fā)聲:<b class='flag-5'>文</b><b class='flag-5'>心</b><b class='flag-5'>一言</b>4.0在國(guó)內(nèi)可以取代ChatGPT!事實(shí)真的如此嗎?

    百度一言用戶破2億,AI原生應(yīng)用開(kāi)發(fā)數(shù)量達(dá)19萬(wàn)

    此外,李彥宏還提到,百度在去年 8 月宣布開(kāi)放一言后,不僅在C端借助大模型改造用戶產(chǎn)品,將AI功能融入旗下多款產(chǎn)品;同時(shí)在B端,通過(guò)云業(yè)務(wù)推出企業(yè)級(jí)站式大模型平臺(tái)——千帆大模型平
    的頭像 發(fā)表于 04-16 15:05 ?539次閱讀

    百度一言新增定制聲音功能,數(shù)秒即可生成個(gè)人語(yǔ)音

    通過(guò)IT之家所述,用戶只需啟動(dòng)一言App并點(diǎn)擊底部“+”按鈕,進(jìn)入創(chuàng)建智能體界面;在聲音設(shè)置處找到專為個(gè)人量身打造的“創(chuàng)建我的聲音”功能。
    的頭像 發(fā)表于 04-07 16:20 ?721次閱讀

    極越01 OTA V1.4.0升級(jí),融合一言等技術(shù),實(shí)現(xiàn)人車家深度融合

    平指出,目前極越 01已成功整合百度地圖、一言、Apollo以及小度等多項(xiàng)技術(shù)。此外,百度 Apollo 自動(dòng)駕駛視覺(jué)大模型 VTA
    的頭像 發(fā)表于 03-26 11:20 ?627次閱讀

    一言將在2024年貢獻(xiàn)數(shù)十億元的增量收入

    百度一言在2024年有望為百度帶來(lái)數(shù)十億元人民幣的增量收入,這預(yù)測(cè)由百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏親自公布。這
    的頭像 發(fā)表于 03-04 11:32 ?1057次閱讀

    百度起訴“一言”公司涉嫌商標(biāo)侵權(quán),不正當(dāng)競(jìng)爭(zhēng)糾紛即將開(kāi)庭

    近日,北京百度網(wǎng)訊科技有限公司與家名為“一言(天津)智能科技有限公司”的公司之間的則不正當(dāng)競(jìng)爭(zhēng)糾紛案件引發(fā)了業(yè)界的廣泛關(guān)注。據(jù)悉,該
    發(fā)表于 02-06 11:44 ?1486次閱讀

    一言APP上線數(shù)字分身功能

    一言APP近日上線了項(xiàng)令人興奮的新功能——數(shù)字分身。這功能允許用戶輕松創(chuàng)建自己的個(gè)性化虛擬形象,為用戶帶來(lái)全新的互動(dòng)體驗(yàn)。
    的頭像 發(fā)表于 02-04 10:32 ?1038次閱讀

    百度一言支持鍵生成專屬數(shù)字分身

    百度一言APP正式上線了項(xiàng)令人矚目的新功能:用戶只需張照片、錄制三句話,就能輕松擁有個(gè)
    的頭像 發(fā)表于 02-03 09:33 ?671次閱讀

    百度一言用戶規(guī)模突破1億

    在近日,百度公布個(gè)令人振奮的消息:一言大模型的用戶規(guī)模已經(jīng)突破了1億。
    的頭像 發(fā)表于 01-02 16:10 ?578次閱讀

    規(guī)模突破1億!一言披露最新用戶規(guī)模

    一言用戶規(guī)模突破1億?!?2月28日,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任王海峰在第十屆WAVE SUMMIT深度學(xué)習(xí)開(kāi)發(fā)者大會(huì)上宣布。會(huì)上,王海峰以《
    的頭像 發(fā)表于 12-29 15:58 ?520次閱讀

    一言用戶規(guī)模破1億 應(yīng)用已突破4000款

    一言用戶規(guī)模破1億 應(yīng)用已突破4000款 在第十屆WAVE SUMMIT深度學(xué)習(xí)開(kāi)發(fā)者大會(huì)上百度首席技術(shù)官王海峰透露了組數(shù)據(jù),自8月31日獲準(zhǔn)開(kāi)放對(duì)公眾提供服務(wù)以來(lái),
    的頭像 發(fā)表于 12-28 18:18 ?1007次閱讀

    百度一言開(kāi)通會(huì)員后可解鎖大模型4.0

    百度一言開(kāi)通會(huì)員后可解鎖大模型4.0 今天百度上線
    的頭像 發(fā)表于 11-01 15:58 ?1199次閱讀

    華為最新消息覽 華為申請(qǐng)“遙遙領(lǐng)先”商標(biāo)

    華為申請(qǐng)“遙遙領(lǐng)先”商標(biāo) 華為余承東的標(biāo)志語(yǔ)言“遙遙領(lǐng)先”已經(jīng)成為網(wǎng)絡(luò)熱詞;或者說(shuō)是個(gè)標(biāo)簽、種情懷,小編甚至在蘋果發(fā)布會(huì)的轉(zhuǎn)播中看到滿屏的“遙遙
    的頭像 發(fā)表于 10-30 17:31 ?781次閱讀