0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Mistral中杯代碼能力完勝GPT-4,成本暴降2/3

深度學習自然語言處理 ? 來源:新智元 ? 2023-12-18 16:55 ? 次閱讀

小模型的風潮,最近愈來愈盛,Mistral和微軟分別有所動作。而網(wǎng)友實測發(fā)現(xiàn),Mistral-medium的代碼能力竟然完勝了GPT-4,而所花成本還不到三分之一。

最近,「小語言模型」忽然成為熱點。

本周一,剛剛完成4.15億美元融資的法國AI初創(chuàng)公司Mistral,發(fā)布了Mixtral 8x7B模型。

715336d2-9d7c-11ee-8b88-92fbcf53809c.png

這個開源模型盡管尺寸不大,小到足以在一臺內(nèi)存100GB以上的電腦上運行,然而在某些基準測試中卻能和GPT-3.5打平,因此迅速在開發(fā)者中贏得了一片稱贊。

之所以叫Mixtral 8x7B,是因為它結合了為處理特定任務而訓練的各種較小模型,從而提高了運行效率。

這種「稀疏專家混合」模型并不容易實現(xiàn),據(jù)說OpenAI在今年早些時候因為無法讓MoE模型正常運行,而不得不放棄了模型的開發(fā)。

緊接著,就在第二天,微軟又發(fā)布了全新版本的Phi-2小模型。

跟Mistral的70億參數(shù)比,Phi-2小到可以在手機上跑,只有27億參數(shù)。相比之下,GPT-4的參數(shù)達到了一萬億。

Phi-2在精心挑選的數(shù)據(jù)集上進行了訓練,數(shù)據(jù)集的質(zhì)量足夠高,因此即使手機的計算能力有限,也能確保模型生成準確的結果。

雖然還不清楚微軟或其他軟件制造商將如何使用小型模型,但最明顯的好處,就是降低了大規(guī)模運行AI應用的成本,并且極大地拓寬了生成式AI技術的應用范圍。

這是一件大事。

Mistral-medium代碼生成完勝GPT-4

最近,Mistral-medium已經(jīng)開放內(nèi)測。

有博主對比了開源的Mistral-medium和GPT-4的代碼生成能力,結果顯示,Mistral-medium比GPT-4的代碼能力更強,然而成本卻只需GPT-4的3成!

7163a274-9d7c-11ee-8b88-92fbcf53809c.png

總價來說就是:

1)Mistral會始終完成工作,完成度很高;

2)不會在冗長的解釋性輸出上浪費token;

3)提供的建議非常具體。

第一題,「編寫用于生成斐波那契素數(shù)的PyTorch數(shù)據(jù)集的cuda優(yōu)化代碼」。

Mistral-Medium生成的代碼嚴肅、完整。

716dbc64-9d7c-11ee-8b88-92fbcf53809c.png

7178e45e-9d7c-11ee-8b88-92fbcf53809c.png

71847daa-9d7c-11ee-8b88-92fbcf53809c.png

而GPT-4生成的代碼,就差強人意了。

浪費了很多token,卻沒有輸出有用的信息。

7189dd40-9d7c-11ee-8b88-92fbcf53809c.png

然后,GPT-4只給出了骨架代碼,并沒有具體的相關代碼。

719013d6-9d7c-11ee-8b88-92fbcf53809c.png

第二道題:「編寫高效的Python代碼,將大約10億個大型Apache HTTP訪問文件攝取到 SqlLite數(shù)據(jù)庫中,并使用它來生成對sales.html和product.html的訪問直方圖」。

Mistral的輸出非常精彩,雖然log不是CSV格式的,但修改起來很容易。

719b463e-9d7c-11ee-8b88-92fbcf53809c.png

71a47db2-9d7c-11ee-8b88-92fbcf53809c.png

71af633a-9d7c-11ee-8b88-92fbcf53809c.png

GPT-4依舊拉跨。

71bb5f0a-9d7c-11ee-8b88-92fbcf53809c.png

71c60e28-9d7c-11ee-8b88-92fbcf53809c.png

71d27d48-9d7c-11ee-8b88-92fbcf53809c.png

此前,這位博主測試過多個代碼生成模型,GPT-4一直穩(wěn)居第一。

而現(xiàn)在,把它拉下寶座的強勁對手Mistral-medium終于出現(xiàn)了。

雖然只發(fā)布了兩個例子,但博主測試了多個問題,結果都差不多。

他建議:鑒于Mistral-medium在代碼生成質(zhì)量上有更好的體驗,應該把它整合到各地的代碼copilot中。

71d73d7e-9d7c-11ee-8b88-92fbcf53809c.png

有人按照每1000token算出了輸入和輸出的成本,發(fā)現(xiàn)Mistral-medium比起GPT-4直接降低了70%!

71e45662-9d7c-11ee-8b88-92fbcf53809c.png

的確,節(jié)省了70%的token費用,可不是一件小事。甚至還可以通過不冗長的輸出,來進一步節(jié)省成本。

71efad0a-9d7c-11ee-8b88-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3074

    瀏覽量

    48592
  • 代碼
    +關注

    關注

    30

    文章

    4700

    瀏覽量

    68117
  • 語言模型
    +關注

    關注

    0

    文章

    492

    瀏覽量

    10230

原文標題:Mistral攜微軟引爆「小語言模型」潮!Mistral中杯代碼能力完勝GPT-4,成本暴降2/3

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力GPT-4 Turbo

    超過GPT-4 Turbo,數(shù)學能力代碼能力更是超過了Open AI最新一代GPT模型GPT-4
    的頭像 發(fā)表于 10-24 11:39 ?237次閱讀

    Mistral Large 2現(xiàn)已在Amazon Bedrock中正式可用

    。Mistral Large 2Mistral Large的最新版本,Mistral AI表示其在多語言能力、數(shù)學、推理、
    的頭像 發(fā)表于 07-26 08:07 ?279次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出的錯誤而設計,其獨特的作用在于,讓人們能夠用GPT-4來查找GP
    的頭像 發(fā)表于 06-29 09:55 ?476次閱讀

    OpenAI API Key獲?。洪_發(fā)人員申請GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力,成為了許多開發(fā)者的首選工具。獲取GPT-4 API Key并將其應用于項目,如開發(fā)一個ChatGPT聊天應用,不僅是實踐人工智能技術
    的頭像 發(fā)表于 06-24 17:40 ?1854次閱讀
    OpenAI API Key獲?。洪_發(fā)人員申請<b class='flag-5'>GPT-4</b> API Key教程

    開發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價格詳情指南

    ,高達每分鐘1000萬字符。 速度 :GPT-4o的速度是GPT-4 Turbo的兩倍。 視覺能力 :在視覺能力相關的評估,
    的頭像 發(fā)表于 05-29 16:00 ?9262次閱讀
    開發(fā)者如何調(diào)用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價格詳情指南

    OpenAI全新GPT-4o能力炸場!速度快/成本低,能讀懂人類情緒

    ”的意思。GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅為
    的頭像 發(fā)表于 05-15 00:15 ?7732次閱讀

    阿里云發(fā)布通義千問2.5大模型,多項能力超越GPT-4

    阿里云隆重推出了通義千問 2.5 版,宣稱其“技術進步,全面超越GPT-4”,尤其是在中文環(huán)境的多種任務(如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估)方面表現(xiàn)出色,超越了GPT-4
    的頭像 發(fā)表于 05-09 14:17 ?869次閱讀

    商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標GPT-4 Turbo

    商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標GPT-4 Turbo 4月23日,商湯科技董事長兼CEO徐立在2024商湯技術交流日上發(fā)布了行業(yè)首個云、端、邊全棧大模型產(chǎn)品矩陣,能夠滿足不同規(guī)模
    的頭像 發(fā)表于 04-24 16:49 ?1023次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進步,如今再次更新至性能卓越的GPT-4 Turbo模型,這無疑將使得Copilot功能再上新臺階。
    的頭像 發(fā)表于 03-13 13:42 ?632次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標桿

    近日,AI領域的領軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語言能力等關鍵領域展現(xiàn)出卓越性能,成功擊敗了此前被廣泛認為是全球最強AI模型的GPT-4,樹立了新的行業(yè)基準。
    的頭像 發(fā)表于 03-05 09:49 ?596次閱讀

    ChatGPT plus有什么功能?OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能

    OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能分析解答 在最近的OpenAI DevDay上,該組織發(fā)布了一項備受期待的公告:推出GPT-4 Turbo,這是對其突破性AI模型
    的頭像 發(fā)表于 12-13 09:19 ?1008次閱讀
    ChatGPT plus有什么功能?OpenAI 發(fā)布 <b class='flag-5'>GPT-4</b> Turbo 目前我們所知道的功能

    AI觀察 | 今年最火的GPT-4,正在締造科幻版妙手仁心!

    近來,微軟對于提示工程能力的最新研究 1 (鏈接詳見文末)再次吸引了一眾媒體的目光:“無需額外微調(diào)、無需專業(yè)策劃,僅憑提示GPT-4就能化身專家!”報道這樣描述道 2 。 基于最新提
    的頭像 發(fā)表于 12-11 08:15 ?431次閱讀
    AI觀察 | 今年最火的<b class='flag-5'>GPT-4</b>,正在締造科幻版妙手仁心!

    新火種AI|谷歌深夜發(fā)布復仇神器Gemini,原生多模態(tài)碾壓GPT-4

    谷歌背水一戰(zhàn),發(fā)布Gemini,狙擊GPT-4
    的頭像 發(fā)表于 12-08 09:09 ?1060次閱讀
    新火種AI|谷歌深夜發(fā)布復仇神器Gemini,原生多模態(tài)碾壓<b class='flag-5'>GPT-4</b>?

    OpenAI發(fā)布的GPT-4 Turbo版本ChatGPT plus有什么功能?

    OpenAI的GPT-4 Turbo以前所未有的功能和價格改變?nèi)斯ぶ悄艿奈磥?在人工智能領域的一次里程碑式活動,OpenAI開發(fā)者大會上發(fā)布了GPT-4 Turbo,這是突破性人工智能模型
    的頭像 發(fā)表于 12-05 17:57 ?2313次閱讀
    OpenAI發(fā)布的<b class='flag-5'>GPT-4</b> Turbo版本ChatGPT plus有什么功能?

    ChatGPT重磅更新 OpenAI發(fā)布GPT-4 Turbo模型價格大2/3

    ChatGPT重磅更新 OpenAI發(fā)布GPT-4 Turbo模型價格大2/3 目前OpenAI算是全球大模型的引領者,一舉一動都牽動著大家的關注,現(xiàn)在ChatGPT迎來重磅更新。
    的頭像 發(fā)表于 11-07 18:20 ?2724次閱讀
    ChatGPT重磅更新 OpenAI發(fā)布<b class='flag-5'>GPT-4</b> Turbo模型價格大<b class='flag-5'>降</b><b class='flag-5'>2</b>/<b class='flag-5'>3</b>