0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

開源風波后在AlpacaEval直追GPT4,零一靠技術如何重建生態(tài)信心

AI科技大本營 ? 來源:AI科技大本營 ? 2023-12-11 17:39 ? 次閱讀

斯坦福大學研發(fā)的大語言模型評測 AlpacaEvalLeaderboard備受業(yè)內(nèi)認可,在 2023 年 12 月 7 日 更新的排行榜中,Yi-34B-Chat 以 94.08% 的勝率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 經(jīng)認證的模型類別中,成為僅次于 GPT-4 英語能力的大語言模型。

3ed85ecc-9808-11ee-8b88-92fbcf53809c.jpg

同一周,在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat也以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現(xiàn)追平GPT-3.5。

多個Benchmark遙遙領先

在五花八門的大模型評測中,伯克利LMSYS ORG排行榜采用了一個最為接近用戶體感的「聊天機器人競技場」特殊測評模式,讓眾多大語言模型在評測平臺隨機進行一對一 battle,通過眾籌真實用戶來進行線上實時盲測和匿名投票,11月份經(jīng)25000的真實用戶投票總數(shù)計算了20個大模型的總得分。
Elo評分越高,說明模型在真實用戶體驗上的表現(xiàn)越出色,可說是眾多大模型評測集中最能展現(xiàn)「Moment of Truth」真實關鍵一刻” 的用戶導向體驗對決。

3ee46bb8-9808-11ee-8b88-92fbcf53809c.jpg

在開源模型中,Yi-34B-Chat成為當之無愧的「最強王者」之一(英語能力),LMSYS ORG 在12月8日官宣11月份總排行時評價:「Yi-34B-Chat 和 Tulu-2-DPO-70B 在開源界的進擊表現(xiàn)已經(jīng)追平 GPT-3.5」。

風波終結(jié),爭議理清

Yi-34B開源發(fā)布后,開發(fā)者Eric Hartford發(fā)現(xiàn)了模型存在的一個問題,就簡略留言在 Yi 的項目頁面。然而Eric自己也沒有預想到,他的留言引發(fā)了后續(xù)輿論關于Yi模型「抄襲」LLaMA的質(zhì)疑。

他在郵件中寫道,「感謝你們提供了一個優(yōu)秀的模型。Yi模型使用了與LLaMA模型完全相同的架構(gòu),只是將兩個張量改了名字。由于圍繞LLaMA架構(gòu)有很多投資和工具,保持張量名稱的一致性是有價值的?!笶ric建議,在Yi被廣泛傳播前,及時恢復張量名稱。 客觀來說,一個模型核心技術護城河是在架構(gòu)之上,通過數(shù)據(jù)訓練獲得的參數(shù)和代碼。大多數(shù)有志于參與基座大模型競爭的團隊,也多是從零開始,用高質(zhì)量的數(shù)據(jù)集再進行訓練,普遍都是在沿用LLaMA架構(gòu)。零一后來解釋他們?yōu)榱藞?zhí)行對比實驗的需要,對部分推理參數(shù)進行了重新命名,原始出發(fā)點是為了充分測試模型,而非刻意隱瞞來源。

身處這場輿論風暴的中心,Eric 意識到了可能給一些人帶來了誤解,開始解釋自己之前的發(fā)言。

3ef41dba-9808-11ee-8b88-92fbcf53809c.jpg

他在X(twitter)上寫道,「他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構(gòu)。架構(gòu)是學術研究的產(chǎn)物,已經(jīng)發(fā)表在論文中,任何人都可以自由使用,這絲毫不減損Yi團隊的成就。他們從零開始使用自己創(chuàng)建的數(shù)據(jù)集訓練Yi,對開源領域的貢獻是值得贊揚的。使用Llama架構(gòu)沒有任何問題。訓練才是關鍵。Yi給了我們目前可獲得的最佳模型,沒有任何可抱怨的?!?現(xiàn)在,Eric 自己也在使用Yi-34B 系列,用Yi-34b-200k數(shù)據(jù)集訓練其他的模型產(chǎn)品。 Yi模型開源首月,數(shù)據(jù)也很亮眼。在Hugging Face社區(qū)下載量為16.8萬,魔搭社區(qū)下載量1.2萬。在GitHub 獲得超過4900個Stars。

由于性能表現(xiàn)強勁,多家知名公司和機構(gòu)推出了基于Yi模型基座的微調(diào)模型,比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型,南方科技大學和粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院(簡稱IDEA研究院)認知計算與自然語言研究中心(簡稱CCNL中心)聯(lián)合發(fā)布的SUS-Chat-34B等,均性能表現(xiàn)優(yōu)異。 而AMD和Hugging Face合作的GPU加速大模型的實驗中,也選擇了Yi-6B作為范例項目。

模型好不好,開發(fā)者最知道在大模型實際使用體驗上,最有發(fā)言權(quán)的還是一線的開發(fā)者。 知名技術作者蘇洋表示,在他觀察的近期Hugging Face榜單中,前三十名有一半多都是 Yi 和其他用戶微調(diào)的 Yi-34B 的變體模型,原本占據(jù)榜單頭部的 68B 和 70B 模型的數(shù)量目前只留有幾個,「從這點看 Yi 對于開源生態(tài)的幫助還是非常巨大的?!?他會時不時的瀏覽下 HF 的榜單,在最近榜單中的前三十名,有一半多都是 Yi 和其他用戶微調(diào)的 Yi-34B 的變體模型,原本占據(jù)榜單頭部的 68B 和 70B 模型的數(shù)量目前只留有幾個,從這點看 Yi 對于開源生態(tài)的幫助還是非常巨大的。

蘇洋還將他的訓練經(jīng)驗和心得在CSDN上做了分享(https://blog.csdn.net/soulteary/article/details/134904434)。

3f1c556e-9808-11ee-8b88-92fbcf53809c.png

蘇洋認為 34B 普通用戶努努力還是能自己相對低成本跑起來的,68 和 70B 的模型想要本地運行,需要更多的資源。但其實目前分數(shù)其實相比較 34B 拉不開太多,也就三四分平均分,但參數(shù)量差了一倍。換言之,企業(yè)想部署使用,所需要的成本也可以得到非常大的節(jié)約。

目前國產(chǎn)大模型在開源榜單上已經(jīng)是第一梯隊,但如果把競爭范圍追加到閉源模型、尤其是海外的模型,仍有很大的距離要去追趕。目前的普遍體驗是開源模型最多只有 GPT-3.5 + 的水平。

蘇洋認為國產(chǎn)大模型,是能夠很快追趕至第一梯隊的。時間也會證明大模型自身的價值,以及驗證出團隊是否對開源有真的持續(xù)投入。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    493

    瀏覽量

    10230
  • 聊天機器人
    +關注

    關注

    0

    文章

    329

    瀏覽量

    12272
  • 大模型
    +關注

    關注

    2

    文章

    2228

    瀏覽量

    2269

原文標題:開源風波后在 AlpacaEval 直追 GPT4,零一靠技術如何重建生態(tài)信心

文章出處:【微信號:AI科技大本營,微信公眾號:AI科技大本營】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    請回答OpenHarmony | 關于開源生態(tài)的未來想象,我們現(xiàn)場回答

    第三屆OpenHarmony技術大會即將啟幕 今年相聚,OpenHarmony又迎來了怎樣的突破與發(fā)展? 萬物智聯(lián)的時代,如何通過技術創(chuàng)新引領智能未來? OpenHarmony的開源
    發(fā)表于 10-12 00:09

    開放原子開源生態(tài)大會OpenHarmony生態(tài)主題演講報名開啟

    展示OpenHarmony的技術創(chuàng)新和產(chǎn)業(yè)落地成果,分享開源社區(qū)生態(tài)進展。 誠邀全球開源操作系統(tǒng)產(chǎn)業(yè)伙伴、技術大咖和學術專家,共同見證
    發(fā)表于 09-19 22:02

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型MMLU上得分為82%, LMSYS排行榜上的聊天偏好測試中表
    的頭像 發(fā)表于 07-21 10:20 ?815次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4</b>o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜

    【議題征集】國際開源及RISC-V人才暨開源技術生態(tài)之旅

    【議題征集】國際開源及RISC-V人才暨開源技術生態(tài)之旅
    的頭像 發(fā)表于 07-02 08:36 ?210次閱讀
    【議題征集】國際<b class='flag-5'>開源</b>及RISC-V人才暨<b class='flag-5'>開源</b><b class='flag-5'>技術</b>與<b class='flag-5'>生態(tài)</b>之旅

    國內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和多模態(tài)GPT4o API調(diào)用開發(fā)教程!

    1. 前言 ChatGPT-4o API 是 OpenAI 提供的強大工具,可用于自然語言處理和多模態(tài)任務。國內(nèi)直聯(lián)使用這些服務需要一些配置和技巧。本文將詳細介紹GPT-4o模型以及如何獲取
    的頭像 發(fā)表于 06-08 00:33 ?4083次閱讀
    國內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和多模態(tài)<b class='flag-5'>GPT4</b>o API調(diào)用開發(fā)教程!

    開發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價格詳情指南

    ,高達每分鐘1000萬字符。 速度 :GPT-4o的速度是GPT-4 Turbo的兩倍。 視覺能力 :視覺能力相關的評估中,GPT-4o表現(xiàn)優(yōu)于G
    的頭像 發(fā)表于 05-29 16:00 ?9296次閱讀
    開發(fā)者如何調(diào)用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價格詳情指南

    OpenAI發(fā)布GPT-4o模型,供全體用戶免費使用

    OpenAI首席技術官穆里·穆拉蒂(Muri Murati)指出,GPT-4o具備與GPT-4相同的智能水平,且文本、圖像及語音處理方面有顯著進步。
    的頭像 發(fā)表于 05-14 11:17 ?416次閱讀

    股價久違飆漲,商湯要用自己的Scaling law挑戰(zhàn)GPT4

    前一天的“2024年商湯技術交流日”上,商湯發(fā)布了對標GPT4-Turbo的大模型日日新大模型SenseNova5.0,追趕GPT4可能是當下中國大模型行業(yè)的集體目
    的頭像 發(fā)表于 05-08 08:05 ?276次閱讀
    股價久違飆漲,商湯要用自己的Scaling law挑戰(zhàn)<b class='flag-5'>GPT4</b>

    上海站報名啟動! 2023年開源產(chǎn)業(yè)生態(tài)大會OpenHarmony生態(tài)分論壇

    作為年內(nèi)開源領域不容錯過的科技盛宴,2023年開源產(chǎn)業(yè)生態(tài)大會將于12月19日在上海盛大開幕。本次活動由上海市經(jīng)濟和信息化委員會、上海市科學技術協(xié)會和\"科創(chuàng)中國\"
    發(fā)表于 11-24 14:55

    GPT4再升級,更強大更便宜!不懂代碼也能生成應用,享受分成

    GPT-4 Turbo以及ChatGPT的一系列升級內(nèi)容。 ? OpenAI自去年底推出ChatGPT之后享譽全球,近一年來不斷推進技術和應用創(chuàng)新。該公司強調(diào),其今年3月發(fā)布的GPT-4至今仍是世界上能力
    的頭像 發(fā)表于 11-14 00:23 ?1858次閱讀

    首屆OpenHarmony競賽訓練營結(jié)營頒獎,75所高校學子助力建設開源生態(tài)

    共有7個賽隊脫穎而出。 11月4日“技術生態(tài),智聯(lián)贏未來”第二屆開放原子開源基金會OpenHarmony
    發(fā)表于 11-07 17:10

    陳海波:OpenHarmony技術領先,產(chǎn)學研深度協(xié)同,生態(tài)蓬勃發(fā)展

    11月4日,以“技術生態(tài),智聯(lián)贏未來”為主題的第二屆OpenHarmony技術大會在北京隆重舉辦。本次大會由OpenAtom OpenHarmony(簡稱“OpenHarmony\&
    發(fā)表于 11-06 14:35

    OpenHarmony技術大會:深開鴻引領技術革新,智創(chuàng)開源生態(tài)未來

    11月4日,第二屆開放原子開源基金會OpenHarmony技術大會在北京國家會議中心盛大開幕。本屆大會以“技術生態(tài),智聯(lián)贏未來”為主題,全
    的頭像 發(fā)表于 11-05 08:33 ?408次閱讀
    OpenHarmony<b class='flag-5'>技術</b>大會:深開鴻引領<b class='flag-5'>技術</b>革新,智創(chuàng)<b class='flag-5'>開源</b><b class='flag-5'>生態(tài)</b>未來

    技術生態(tài) 智聯(lián)贏未來,第二屆OpenHarmony技術大會圓滿舉行

    了OpenHarmony推動千行百業(yè)數(shù)字化轉(zhuǎn)型中的重要作用。他表示,OpenHarmony自2020年9月10日開源以來,已經(jīng)走過了不凡的三年,得到了廣大開源貢獻者的熱情投入,不斷推動著操作系統(tǒng)的
    發(fā)表于 11-04 14:59

    技術生態(tài),智聯(lián)贏未來 第二屆OpenHarmony技術大會即將在京啟幕

    2023年11月4日,第二屆開放原子開源基金會OpenHarmony技術大會即將在北京國家會議中心盛大開幕。本次大會由OpenAtom OpenHarmony(簡稱“OpenHarmony
    發(fā)表于 10-31 11:27