0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Stability AI推出迄今為止更小、更高效的1.6B語言模型

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2024-01-23 10:11 ? 次閱讀

Stability AI 宣布推出迄今為止最強(qiáng)大的小語言模型之一 Stable LM 2 1.6B。以英語、西班牙語、德語、意大利語、法語、葡萄牙語和荷蘭語的多語言數(shù)據(jù)為基礎(chǔ)進(jìn)行了訓(xùn)練,體積小、速度快,降低了硬件門檻;并提供了完全透明的訓(xùn)練細(xì)節(jié),旨在讓開發(fā)人員和模型創(chuàng)建者能夠快速進(jìn)行實(shí)驗(yàn)和迭代。

Stable LM 是一種文本內(nèi)容生成 LLM,Stability AI 于 2023 年 4 月首次推出了 30 億和 70 億參數(shù)模型。新的 StableLM 模型實(shí)際上是 Stability AI 在 2024 年發(fā)布的第二個(gè)模型,此前該公司在早些時(shí)候還發(fā)布了一個(gè) Stable Code 3B。

Stability AI 聲稱,Stable LM 2 1.6B 在大多數(shù)基準(zhǔn)測(cè)試中均優(yōu)于其他參數(shù)低于 20 億個(gè)的小語言模型,如微軟的 Phi-1.5 (1.3B) 和 Phi-2 (2.7B)、TinyLlama 1.1B 或 Falcon 1B。

6999b044-b913-11ee-8b88-92fbcf53809c.png69b6cbac-b913-11ee-8b88-92fbcf53809c.png69e0a7ec-b913-11ee-8b88-92fbcf53809c.png69f47498-b913-11ee-8b88-92fbcf53809c.png

不過他們也警告稱,由于小型、低容量語言模型的特性,Stable LM 2 1.6B 可能會(huì)出現(xiàn)高幻覺率、潛在的有毒語言等類似的常見問題?!拔覀円笊鐓^(qū)在構(gòu)建應(yīng)用程序時(shí)牢記這一點(diǎn),并采取適當(dāng)措施確保以負(fù)責(zé)任的方式進(jìn)行開發(fā)?!?br />
Stable LM 2 1.6B 目前可在商業(yè)和非商業(yè)領(lǐng)域使用,只要擁有 Stability AI 會(huì)員資格,即可在 Hugging Face 上測(cè)試該模型。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    490

    瀏覽量

    10225
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    252

    瀏覽量

    285

原文標(biāo)題:Stability AI推出更小、更高效的1.6B語言模型

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英偉達(dá)發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    速度比原70B模型提升2.2倍,具備更準(zhǔn)確和更高效的運(yùn)算效率;能夠大幅降低運(yùn)行成本。 ? ? ? 通過NAS技術(shù)微調(diào);大幅降低了內(nèi)存消耗、計(jì)算復(fù)雜性;Llama-3.1-Nemotron-51
    的頭像 發(fā)表于 09-26 17:30 ?502次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄今為止功能最強(qiáng)大、用途最廣泛的
    的頭像 發(fā)表于 08-02 15:42 ?310次閱讀

    Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發(fā)布了一款全新的領(lǐng)先語言模型Mistral NeMo 12B。開發(fā)者可以輕松定制和部署該模型
    的頭像 發(fā)表于 07-27 11:04 ?582次閱讀

    安霸生成式AI芯片解決方案助力本地處理大型語言模型

    隨著 AI 技術(shù)的不斷進(jìn)步,十年前還只能在書本和科幻電影中看到的功能,如今隨處可見。然而,迄今為止,對(duì)性能有著高要求的最新生成式 AI 技術(shù)應(yīng)用通常只能運(yùn)行在云端。
    的頭像 發(fā)表于 06-26 11:32 ?614次閱讀

    智譜AI發(fā)布全新多模態(tài)開源模型GLM-4-9B

    近日,智譜AI在人工智能領(lǐng)域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的多模態(tài)能力,再次刷新了業(yè)界對(duì)于大型
    的頭像 發(fā)表于 06-07 09:17 ?597次閱讀

    【大語言模型:原理與工程實(shí)踐】揭開大語言模型的面紗

    了探索更大、更高效模型架構(gòu)和訓(xùn)練方法的空間。在實(shí)際應(yīng)用中,大語言模型的縮放定律推動(dòng)了自然語言處理等領(lǐng)域的發(fā)展,提升了應(yīng)用效果和用戶體驗(yàn)。此外
    發(fā)表于 05-04 23:55

    Stability AI發(fā)布Stable Code Instruct 3B語言模型,可編譯多種編程語言

    據(jù)報(bào)道,Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B語言
    的頭像 發(fā)表于 03-27 10:04 ?385次閱讀

    搭載星火認(rèn)知大模型AI鼠標(biāo):一鍵呼出AI助手,辦公更高效

    搭載星火認(rèn)知大模型AI鼠標(biāo):一鍵呼出AI助手,辦公更高效 在這個(gè)AI時(shí)代,如果你想在激烈競(jìng)爭(zhēng)的職場(chǎng)中不被淘汰,訊飛
    的頭像 發(fā)表于 03-25 11:52 ?412次閱讀
    搭載星火認(rèn)知大<b class='flag-5'>模型</b>的<b class='flag-5'>AI</b>鼠標(biāo):一鍵呼出<b class='flag-5'>AI</b>助手,辦公<b class='flag-5'>更高效</b>

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨(dú)特的功能吸引了眾多關(guān)注。此
    的頭像 發(fā)表于 03-22 10:30 ?710次閱讀

    Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

    近日,業(yè)界領(lǐng)先的AI技術(shù)公司Stability AI與中國AI創(chuàng)業(yè)公司Morph AI達(dá)成重要合作。雙方宣布共同
    的頭像 發(fā)表于 03-05 10:44 ?769次閱讀

    螞蟻集團(tuán)推出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense

    近日,螞蟻集團(tuán)聯(lián)合武漢大學(xué)宣布成功研發(fā)出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense。這一創(chuàng)新模型由螞蟻集團(tuán)的AI創(chuàng)新研發(fā)部門NextEvo與武漢大學(xué)共同完成,是迄今為止國際上參數(shù)規(guī)模
    的頭像 發(fā)表于 03-04 11:22 ?707次閱讀

    Stability AI試圖通過新的圖像生成人工智能模型保持領(lǐng)先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大,而Stable Diffusion是許多其他文本到圖像生成
    的頭像 發(fā)表于 02-19 16:03 ?827次閱讀
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>試圖通過新的圖像生成人工智能<b class='flag-5'>模型</b>保持領(lǐng)先地位

    Stability AI推出商業(yè)版會(huì)員計(jì)劃 對(duì)AI模型的商業(yè)使用收費(fèi)

    該公司在一篇博客文章中表示:“隨著我們公司的不斷成熟和規(guī)?;?b class='flag-5'>Stability AI會(huì)員將在助力我們未來的核心模型研發(fā)方面發(fā)揮關(guān)鍵作用。” The Verge聯(lián)系了Stability
    的頭像 發(fā)表于 12-26 16:48 ?784次閱讀

    語言模型簡(jiǎn)介:基于大語言模型模型全家桶Amazon Bedrock

    本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶:Bedrock對(duì)大語言模型進(jìn)行介紹。大
    的頭像 發(fā)表于 12-04 15:51 ?700次閱讀

    研究人員發(fā)現(xiàn)了迄今為止最快的半導(dǎo)體

    科學(xué)家們發(fā)現(xiàn)了他們所說的迄今為止最快、最高效的半導(dǎo)體。盡管這種新材料是用地球上最稀有的元素之一制成,但研究人員表示,有可能會(huì)發(fā)現(xiàn)由更豐富的材料制成的替代物,其運(yùn)行速度相當(dāng)快。
    的頭像 發(fā)表于 11-08 16:28 ?560次閱讀