0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用技術(shù)望遠(yuǎn)鏡看國內(nèi)大模型:文心閃耀 雙榜領(lǐng)跑

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-06-20 09:18 ? 次閱讀

中國大模型應(yīng)用,正在進(jìn)入“可觀測期”。

《中國大模型中標(biāo)項(xiàng)目監(jiān)測報(bào)告(2024年5月)》中顯示,截至5月,中國大模型的相關(guān)中標(biāo)金額已經(jīng)超過2023年全部中標(biāo)項(xiàng)目的披露金額。

在大模型全面落地四處開花的同時(shí),大模型正擺脫“不可觀測”狀態(tài),過去由于大量大模型應(yīng)用在B端,信息相對(duì)封閉,對(duì)于產(chǎn)業(yè)來說,他們很難清晰獲知大模型技術(shù)水平、擅長領(lǐng)域、落地能力,無形中增加了智慧化轉(zhuǎn)型的決策成本。

隨著大模型技術(shù)評(píng)測體系的逐漸成熟,我們仿佛擁有了天文望遠(yuǎn)鏡,可以在群星閃耀中,找到那顆最耀眼的星。

wKgaomZy5EmAdGz7AAHqWvqZB6I677.jpg

最近,國際權(quán)威機(jī)構(gòu)IDC發(fā)布了《中國大模型市場主流產(chǎn)品評(píng)估,2024》,智源研究院打造的FlagEval天秤大模型評(píng)測平臺(tái)也發(fā)布了最新一期模型評(píng)測排行榜單,兩項(xiàng)評(píng)測中百度文心大模型實(shí)現(xiàn)了雙榜奪魁。

“望遠(yuǎn)鏡”背后技術(shù)評(píng)價(jià)機(jī)制

我們可以簡單看看,這兩架“天文望遠(yuǎn)鏡”分別采用了哪些評(píng)價(jià)機(jī)制。

IDC的評(píng)估分為基礎(chǔ)能力和應(yīng)用能力,其中基礎(chǔ)方面涉及問答、推理、創(chuàng)作、數(shù)學(xué)、代碼等能力,應(yīng)用方面既考驗(yàn)toC通用場景,也考驗(yàn)金融、零售、法律等toB細(xì)分場景。

盡管有GPT-4這樣的有力對(duì)手,文心一言仍然在七大維度全面領(lǐng)先。

智源研究院打造的FlagEval天秤大模型測評(píng)平臺(tái)發(fā)布于2023年,面向視頻、語音、多模態(tài)等多個(gè)領(lǐng)域,在FlagEval大語言模型評(píng)測體系當(dāng)前包含6大評(píng)測任務(wù),近30個(gè)評(píng)測數(shù)據(jù)集,超10萬道評(píng)測題目。

wKgZomZy5EqAWk23AAIWRF-cRCQ209.jpg

在閉源對(duì)話模型榜單中,文心大模型4.0以89.72的綜合評(píng)分排名第一,OpenAI的GPT-4o等位列其后。

wKgaomZy5EqAWnKiAAESNkipxcs831.jpg

可見不論是從全領(lǐng)域能力角度進(jìn)行評(píng)估,還是考察至關(guān)重要的大語言水平,文心一言毫無疑問都是中文大模型的榜首,是星海中光芒最耀眼的一顆。

技術(shù)之光

抬頭仰望星空時(shí),我們看到的,其實(shí)是星星幾年,甚至幾十幾百年以前留下的掠影。

同樣,想要讓大模型從“不可觀測”變?yōu)椤翱捎^測”,除了對(duì)當(dāng)下的技術(shù)能力進(jìn)行評(píng)測,我們也要回溯光芒的源頭,也就是大模型的技術(shù)內(nèi)核。

從文心大模型來看,這種技術(shù)之光可以分為兩個(gè)層面:

第一層,是技術(shù)投入的“原生光芒”。

百度對(duì)于深度學(xué)習(xí)的探索挖掘,包括對(duì)AI技術(shù)的應(yīng)用,已經(jīng)有十?dāng)?shù)年之久。在大模型熱還未被掀起的2019年,百度就打造了第一代文心大模型體系,從而才有了建立在文心大模型之上的文心一言。

如今經(jīng)過數(shù)次迭代,文心大模型在理解、生成、邏輯、記憶四大能力讓其他廠商難以望其項(xiàng)背。IDC報(bào)告中就顯示,在數(shù)學(xué)類和代碼類等考驗(yàn)?zāi)P瓦壿嫛⑼评淼饶芰Φ脑u(píng)測中,百度文心大模型體現(xiàn)出了強(qiáng)大的體系化思維、邏輯思維和抽象思維能力。

能力迭代背后,是文心大模型有條不紊的全面技術(shù)布局。

比如通過文心飛槳的聯(lián)合調(diào)優(yōu),通過高效算力和自研框架來提升大模型的訓(xùn)練效率,增加技術(shù)的迭代速度。

wKgaomZy5EuACxItAAKOMedpYks364.jpg

又比如面對(duì)近年來爆火的智能體Agent技術(shù),文心大模型第一時(shí)間推出了文心智能體平臺(tái)。在基礎(chǔ)模型能力上疊加思考增強(qiáng)訓(xùn)練,以基礎(chǔ)模型+思考模型的形式,讓大模型更接近于人類的學(xué)習(xí)、理解和執(zhí)行模式。

像百度自己,就通過這種模式打造了代碼智能體和智能代碼助手Comate,目前Comate生成代碼整體采納率已達(dá)46%,新增代碼中生成比例已達(dá)27%。IDC的報(bào)告中我們也能發(fā)現(xiàn),在代碼類所有6個(gè)細(xì)分維度中,百度均入圍優(yōu)勢廠商。

對(duì)于技術(shù)研發(fā)的深埋與前瞻,讓這顆星體源源不斷的釋放著創(chuàng)新之火,點(diǎn)亮宇宙的一隅。

第二層,是產(chǎn)業(yè)協(xié)作的“折射光芒”。

文心大模型能力的來源,除了自身的研發(fā)投入,還有廣泛的產(chǎn)業(yè)實(shí)踐。

截至目前,文心一言累計(jì)用戶規(guī)模已達(dá)2億,日均調(diào)用量也達(dá)到了2億。這一數(shù)字在同類生成式AI產(chǎn)品中一騎絕塵。

在toB領(lǐng)域,百度一方面將文心大模型全面落地于自身業(yè)務(wù)中,如搜索、地圖、信息流。同時(shí)百度智能云還推出了千帆大模型平臺(tái),打造一站式企業(yè)級(jí)大模型開發(fā)平臺(tái)。不久前,文心大模型還對(duì)外免費(fèi)開放了ERNIE Speed、ERNIE Lite兩款主力模型。

wKgZomZy5EuAfhBEAAInXsHC8Uo866.jpg

在不斷對(duì)外開放的過程中,文心大模型的調(diào)用量呈幾何式增長,合作伙伴與案例也越來越多。從國家電網(wǎng)、南方電網(wǎng)、中國航天這樣的國之重器,到金融保險(xiǎn)領(lǐng)域的浦發(fā)銀行、泰康保險(xiǎn),再到終端領(lǐng)域的榮耀、三星,媒體領(lǐng)域汽車之家……在不斷與合作伙伴共建行業(yè)大模型的過程中,文心大模型已經(jīng)實(shí)現(xiàn)了中國最為廣泛的產(chǎn)業(yè)落地規(guī)模。

在廣泛的產(chǎn)業(yè)合作中,文心大模型得以被真實(shí)應(yīng)用場景滋養(yǎng),不斷從中發(fā)掘細(xì)節(jié)需求,進(jìn)而針對(duì)性地提升技術(shù)能力。

舉例來說,在大量的實(shí)踐中百度得以發(fā)掘,大模型落地過程中,效果、效率和成本都是重要考量。因此,推出了多模型推理技術(shù)來提升推理效率,以降低落地成本。

有對(duì)周圍產(chǎn)業(yè)伙伴光芒的“折射”,我們觀測到的星光可以更加立體。文心大模型的成就不僅僅來自機(jī)構(gòu)評(píng)測的認(rèn)可,更來自一個(gè)個(gè)堅(jiān)實(shí)的落地案例。

大模型星光如何照耀產(chǎn)業(yè)星球

當(dāng)我們望見星光時(shí),它正在向軌道更遠(yuǎn)處運(yùn)行著,從大模型元年,走入了大模型落地元年。

《中國大模型中標(biāo)項(xiàng)目監(jiān)測報(bào)告(2024年5月)》中顯示,今年5月份大模型中標(biāo)項(xiàng)目數(shù)量創(chuàng)下了新高。毫無疑問,隨著大模型“不可觀測性”逐漸褪去,產(chǎn)業(yè)對(duì)于大模型的需求,正在進(jìn)入井噴狀態(tài)。需求暴漲的情況下,大模型要如何站穩(wěn)潮頭,真正在行業(yè)領(lǐng)域站穩(wěn)腳跟?以文心大模型為例,縱觀文心大模型近一年來的動(dòng)作,仿佛是一場星際旅行,不斷從遙遠(yuǎn)的技術(shù)天空貼近我們所在的應(yīng)用星球。

文心大模型留下了技術(shù)的軌跡,通過不斷的研發(fā),讓大模型更加貼近AGI,在能力層面更適應(yīng)應(yīng)用領(lǐng)域的復(fù)雜任務(wù)。

文心大模型也留下了普惠的軌跡,主力模型的免費(fèi)開放,落地成本的不斷降低,都讓大模型更加易用,讓更多產(chǎn)業(yè)伙伴加入行業(yè)大模型的聯(lián)合創(chuàng)新中。

文心大模型還留下了生態(tài)的軌跡,百度對(duì)于開發(fā)者生態(tài)的建設(shè)持之以恒,目前已在全國最大AI社區(qū)“星河社區(qū)”中打造了大模型板塊,也推出了智能體平臺(tái)這樣降低大模型應(yīng)用研發(fā)門檻的工具。開發(fā)生態(tài)的繁榮,讓文心具備更多引力,加速向產(chǎn)業(yè)目標(biāo)行駛而去。

有了這三道清晰的軌跡,我們也就能夠望見文心,包括整體中國大模型的未來將如何到來。

星移斗轉(zhuǎn)中,產(chǎn)業(yè)對(duì)于大模型能力與價(jià)值的認(rèn)知正在逐漸清晰。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29347

    瀏覽量

    267630
  • 文心一言
    +關(guān)注

    關(guān)注

    0

    文章

    123

    瀏覽量

    1209
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2203

    瀏覽量

    2227
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【附實(shí)操視頻】聆思CSK6大模型開發(fā)板接入國內(nèi)主流大模型(星火大模型、一言、豆包、kimi、智譜glm、通義千問)

    接入一言、通義千問、豆包、智譜glm、kimi等國內(nèi)的大模型,但由于各家接口和數(shù)據(jù)格式不一樣,調(diào)試驗(yàn)證會(huì)浪費(fèi)很多時(shí)間。因此本篇以聆思CSK6大
    發(fā)表于 08-22 10:12

    百度模型4.0免費(fèi)了 百度心智能體平臺(tái)免費(fèi)開放模型4.0

    據(jù)悉;7月5日起 百度心智能體平臺(tái)(AgentBuilder) 免費(fèi)開放模型4.0。 開發(fā)者在心智能體平臺(tái)上制作智能體時(shí); 可靈活
    的頭像 發(fā)表于 07-06 17:12 ?1132次閱讀

    百度模型4.0 Turbo,正式發(fā)布 用戶規(guī)模已達(dá)3億

    的最新數(shù)據(jù),并正式發(fā)布模型4.0 Turbo、飛槳框架3.0等最新技術(shù),披露飛槳生態(tài)最
    的頭像 發(fā)表于 06-29 10:06 ?771次閱讀

    紅外熱成像望遠(yuǎn)鏡的新突破----華感科技Mile 2系列

    杭州2024年5月17日?/美通社/ --?華感科技Mile 2熱成像望遠(yuǎn)鏡,是華感2024年最新產(chǎn)品。不久前,華感Mile 2從幾千件參賽作品中脫穎而出,一舉斬獲2024年德國紅點(diǎn)設(shè)計(jì)獎(jiǎng)。這一全新
    的頭像 發(fā)表于 05-22 11:33 ?382次閱讀

    百度模型擴(kuò)展合作領(lǐng)域

    百度創(chuàng)始人兼CEO李彥宏在2024年第一季度財(cái)報(bào)電話會(huì)上宣布,模型API在繼與中國三星、榮耀成功合作后,本季度再度實(shí)現(xiàn)重要突破。小米、OPPO、vivo等主流手機(jī)廠商已全面接入
    的頭像 發(fā)表于 05-17 11:17 ?479次閱讀

    百度首席技術(shù)官王海峰解讀模型的關(guān)鍵技術(shù)和最新進(jìn)展

    4月16日,以“創(chuàng)造未來”為主題的Create 2024百度AI開發(fā)者大會(huì)在深圳國際會(huì)展中心成功舉辦。百度首席技術(shù)官王海峰以“技術(shù)筑基,星河璀璨”為題,發(fā)表演講,解讀了智能體、代碼、多模型等多項(xiàng)
    的頭像 發(fā)表于 04-18 09:20 ?592次閱讀
    百度首席<b class='flag-5'>技術(shù)</b>官王海峰解讀<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>的關(guān)鍵<b class='flag-5'>技術(shù)</b>和最新進(jìn)展

    李彥宏:開源模型將逐漸滯后,模型提升訓(xùn)練與推理效率

    李彥宏解釋道,百度自研的基礎(chǔ)模型—— 4.0,能夠根據(jù)需求塑造出適應(yīng)各類場景的微型版模型,并支持精細(xì)調(diào)整以及后預(yù)訓(xùn)練。相較于直接使用開源模型
    的頭像 發(fā)表于 04-16 14:37 ?372次閱讀

    優(yōu)必選宣布人形機(jī)器人Walker S接入百度模型

    優(yōu)必選宣布人形機(jī)器人Walker S接入百度模型,共同探索中國AI大模型+人形機(jī)器人的應(yīng)用。
    的頭像 發(fā)表于 04-07 10:17 ?806次閱讀

    歐空局完成歐幾里得太空望遠(yuǎn)鏡除冰,提升觀測分辨率

    作為總投入高達(dá)16億美元(當(dāng)前約合115.36億元人民幣)的計(jì)劃,“歐幾里得”太空望遠(yuǎn)鏡旨在深入探究過去100億年間宇宙進(jìn)化歷程以及人類至今仍未揭示的暗物質(zhì)與暗能量奧秘。
    的頭像 發(fā)表于 03-21 15:38 ?469次閱讀

    AIMS望遠(yuǎn)鏡:引領(lǐng)太陽磁場觀測的革命性中紅外觀測系統(tǒng)

    AIMS望遠(yuǎn)鏡是國家自然科學(xué)基金委員會(huì)支持的重大儀器專項(xiàng)(部委推薦)項(xiàng)目,落戶于平均海拔約4000米的青海省海西蒙古族藏族自治州茫崖市冷湖鎮(zhèn)賽什騰山D平臺(tái)。
    的頭像 發(fā)表于 01-26 10:50 ?461次閱讀

    世界首臺(tái)多通道巡天望遠(yuǎn)鏡建成

    望遠(yuǎn)鏡行業(yè)資訊
    北京中科同志科技股份有限公司
    發(fā)布于 :2023年12月29日 09:46:26

    百度模型首批通過大模型標(biāo)準(zhǔn)符合性測試

    12月22日,在全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)人工智能分委會(huì)全體會(huì)議上,百度模型首批通過大模型
    的頭像 發(fā)表于 12-28 11:33 ?567次閱讀
    百度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>首批通過大<b class='flag-5'>模型</b>標(biāo)準(zhǔn)符合性測試

    耀烏鎮(zhèn),“大模型之光”展現(xiàn)了什么?

    當(dāng)烏鎮(zhèn)將目光投向AI,4.0成為大模型之光。
    的頭像 發(fā)表于 11-12 08:53 ?851次閱讀
    <b class='flag-5'>文</b><b class='flag-5'>心</b>耀烏鎮(zhèn),“大<b class='flag-5'>模型</b>之光”展現(xiàn)了什么?

    百度一言開通會(huì)員后可解鎖模型4.0

    百度一言開通會(huì)員后可解鎖模型4.0 今天百度上線
    的頭像 發(fā)表于 11-01 15:58 ?1199次閱讀

    中國計(jì)算機(jī)大會(huì)現(xiàn)場王海峰揭秘模型4.0

    王海峰表示,基于更強(qiáng)平臺(tái)、更優(yōu)數(shù)據(jù)、更好算法,我們訓(xùn)練出規(guī)模更大、效果更好的模型4.0。通過飛槳與的協(xié)同優(yōu)化,
    的頭像 發(fā)表于 10-29 11:35 ?679次閱讀