0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

160億參數(shù),新增多項能力,復(fù)旦MOSS開源了

3D視覺工坊 ? 來源:機(jī)器之心 ? 2023-04-27 15:51 ? 次閱讀

今年 2 月份,機(jī)器之心報道了復(fù)旦大學(xué)推出中國版 ChatGPT 的消息,引起了廣泛關(guān)注。當(dāng)時,邱錫鵬教授就曾表示將于四月份開源 Moss。

昨天,開源版的 Moss 真的來了。

項目地址:https://github.com/OpenLMLab/MOSS

MOSS 是一個支持中英雙語和多種插件的開源對話語言模型,但參數(shù)數(shù)量比 ChatGPT 少得多。在 v0.0.2 之后,團(tuán)隊持續(xù)對其進(jìn)行調(diào)整,推出了 MOSS v0.0.3,也就是目前開源的版本。相比于早期版本,功能也實現(xiàn)了多項更新。

最初的測試中,MOSS 的基礎(chǔ)功能與 ChatGPT 類似,可以按照用戶輸入的指令完成各類自然語言處理任務(wù),包括文本生成、文本摘要、翻譯、代碼生成、閑聊等等。

開放內(nèi)測后,團(tuán)隊繼續(xù)加大中文語料的預(yù)訓(xùn)練:「截止目前,MOSS 003 的基座語言模型已經(jīng)在 100B 中文 token 上進(jìn)行了訓(xùn)練,總訓(xùn)練 token 數(shù)量達(dá)到 700B,其中還包含約 300B 代碼?!?/p>

在開放內(nèi)測后,我們也收集了一些用戶數(shù)據(jù),我們發(fā)現(xiàn)真實中文世界的用戶意圖和 OpenAI InstructGPT 論文中披露的 user prompt 分布有較大差異(這不僅與用戶來自的國家差異有關(guān),也跟產(chǎn)品上線時間有關(guān),早期產(chǎn)品采集的數(shù)據(jù)中存在大量對抗性和測試性輸入),于是我們以這部分真實數(shù)據(jù)作為 seed 重新生成了約 110 萬常規(guī)對話數(shù)據(jù),涵蓋更細(xì)粒度的 helpfulness 數(shù)據(jù)和更廣泛的 harmlessness 數(shù)據(jù)。

內(nèi)容來源:https://www.zhihu.com/question/596908242/answer/2994534005

目前,團(tuán)隊已將 moss-moon-003-base、moss-moon-003-sft、moss-moon-003-sft-plugin 三個模型上傳到 HuggingFace。后續(xù),還有三個模型將會開源。

0ea0e28e-e4ca-11ed-ab56-dac502259ad0.png

根據(jù)項目主頁介紹,moss-moon 系列模型具有 160 億參數(shù),在 FP16 精度下可在單張 A100/A800 或兩張 3090 顯卡運行,在 INT4/8 精度下可在單張 3090 顯卡運行。

團(tuán)隊同時表示,由于模型參數(shù)量較小和自回歸生成范式,MOSS 仍然可能生成包含事實性錯誤的誤導(dǎo)性回復(fù)或包含偏見 / 歧視的有害內(nèi)容,請謹(jǐn)慎鑒別和使用 MOSS 生成的內(nèi)容,請勿將 MOSS 生成的有害內(nèi)容傳播至互聯(lián)網(wǎng)。

新增能力

在 MOSS v0.0.3 中,團(tuán)隊加入了多項新能力。

團(tuán)隊構(gòu)造了約 30 萬插件增強(qiáng)的對話數(shù)據(jù),包含搜索引擎、文生圖、計算器、方程求解等。關(guān)于插件版 MOSS 如何使用,后續(xù)團(tuán)隊將在 GitHub 公布。

0eacf600-e4ca-11ed-ab56-dac502259ad0.png

MOSS v0.0.3 現(xiàn)已引入使用多種插件的能力。

下圖展示了調(diào)用搜索引擎的能力:

0eb1dee0-e4ca-11ed-ab56-dac502259ad0.png

下圖展示了調(diào)用方程求解器的能力:

0eba72d0-e4ca-11ed-ab56-dac502259ad0.png

下圖展示了從文本生成圖片的能力:

0ec1c2ce-e4ca-11ed-ab56-dac502259ad0.png

項目作者孫天祥補(bǔ)充說,MOSS 003 支持啟用插件的能力是通過 meta instruction 來控制,類似 gpt-3.5-turbo 里的 system prompt?!敢驗槭悄P涂刂频模圆⒉荒鼙WC 100% 控制率,以及還存在一些多選插件時調(diào)用不準(zhǔn)、插件互相打架的缺陷,我們正在盡快開發(fā)新的模型來緩解這些問題?!?/p>

下載安裝

下載本倉庫內(nèi)容至本地 / 遠(yuǎn)程服務(wù)器:

git clone https://github.com/OpenLMLab/MOSS.gitcd MOSS

創(chuàng)建 conda 環(huán)境:

conda create --name moss python=3.8 conda activate moss

安裝依賴:

pip install -r requirements.txt

其中 torch 和 transformers 版本不建議低于推薦版本。

根據(jù)協(xié)議,開源的 MOSS 可用于商業(yè)用途:

0ed45e98-e4ca-11ed-ab56-dac502259ad0.png

此外,開發(fā)者也可通過 API 調(diào)用 MOSS 服務(wù),團(tuán)隊將根據(jù)當(dāng)前服務(wù)壓力考慮通過 API 接口形式提供服務(wù),接口格式可參考:https://github.com/OpenLMLab/MOSS/blob/main/moss_api.pdf

目前,已有開發(fā)者根據(jù)開源內(nèi)容進(jìn)行而創(chuàng),比如通過 VideoChat 進(jìn)行視頻問答。

VideoChat 是一款多功能視頻問答工具,結(jié)合了動作識別、視覺字幕和 StableLM 的功能。該工具可為視頻中的任何對象和動作生成密集的描述性字幕,提供一系列語言風(fēng)格以滿足不同的用戶偏好。它支持用戶進(jìn)行不同長度、情緒、語言真實性的對話。

0edbf838-e4ca-11ed-ab56-dac502259ad0.png

項目地址:https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3185

    瀏覽量

    42241
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    491

    瀏覽量

    10225
  • ChatGPT
    +關(guān)注

    關(guān)注

    28

    文章

    1525

    瀏覽量

    7250

原文標(biāo)題:160億參數(shù),新增多項能力,復(fù)旦MOSS開源了

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    云知聲山海大模型多項能力全球領(lǐng)跑

    國內(nèi)人工智能權(quán)威機(jī)構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評測選取海內(nèi)外24個具有代表性的大模型,結(jié)果顯示,山海大模型對齊、智能體、安全等多項能力全球領(lǐng)跑。
    的頭像 發(fā)表于 10-12 14:30 ?273次閱讀
    云知聲山海大模型<b class='flag-5'>多項</b><b class='flag-5'>能力</b>全球領(lǐng)跑

    開放原子開源基金會五月新增捐贈人

    2024年5月,新增以下單位成為開放原子開源基金會及旗下項目捐贈人。
    的頭像 發(fā)表于 09-24 10:48 ?461次閱讀

    緯鋰能發(fā)布的開源電池,循環(huán)壽命超過7000次

    緯鋰能發(fā)布的“開源電池”具備3C超快充電速度,15分鐘可從20%快充至80%SOC,比能量大于160Wh/kg,循環(huán)壽命超過7000次。
    的頭像 發(fā)表于 05-19 11:25 ?1429次閱讀

    通義千問推出1100參數(shù)開源模型

    通義千問近日震撼發(fā)布1100參數(shù)開源模型Qwen1.5-110B,這一舉措標(biāo)志著通義千問在AI領(lǐng)域邁出了重大步伐。該模型成為通義千問全系列首個千億級參數(shù)
    的頭像 發(fā)表于 05-06 10:49 ?513次閱讀

    微信WCDB最新開源版本發(fā)布,優(yōu)化數(shù)據(jù)庫接口及核心邏輯,新增多項功能

    如今,微信已經(jīng)發(fā)布此項重大技術(shù)升級的新版本 WCDB,以及其更為豐富的開發(fā)語言支持,如新增 C++以及對 Java 和 Kotlin 語言的 ORM 提供完整支援,覆蓋越發(fā)廣泛的終端平臺;更強(qiáng)大的 SQL 表達(dá)能力,通過對 Winq 的重新書寫和強(qiáng)化體現(xiàn)出來;
    的頭像 發(fā)表于 04-09 15:59 ?549次閱讀

    阿維塔12發(fā)布3.2.0版本更新,新增多項功能并優(yōu)化細(xì)節(jié)

    特殊車道智能通行功能:城市和鄉(xiāng)村的智駕領(lǐng)航輔助(NCA)和車道巡航輔助(LCC)均新增此功能,支持通過潮汐車道、公交車道控制桿進(jìn)入NCA模式,并實現(xiàn)自動駛出的操作。
    的頭像 發(fā)表于 03-28 14:27 ?476次閱讀

    聯(lián)發(fā)科天璣9300搭載通義千問大模型,阿里云提供解決方案

    通義千問大模型已開源多項版本,包括18、70、140及720
    的頭像 發(fā)表于 03-28 09:55 ?468次閱讀

    全球行業(yè)首次!北醒通過多項DO-160G認(rèn)證測試

    近日,北醒新一代航空器用激光雷達(dá)產(chǎn)品通過多項DO-160G航空機(jī)載設(shè)備環(huán)境標(biāo)準(zhǔn)測試。作為全球首個參與DO-160G認(rèn)證的激光雷達(dá)公司,這一系列測試的通過標(biāo)志著北醒在安全飛行領(lǐng)域上達(dá)到了國際領(lǐng)先水平
    的頭像 發(fā)表于 03-06 16:44 ?279次閱讀

    北醒新一代激光雷達(dá)產(chǎn)品通過多項DO-160G航空機(jī)載設(shè)備環(huán)境標(biāo)準(zhǔn)測試

    近日,北醒新一代航空器用激光雷達(dá)產(chǎn)品通過多項DO-160G航空機(jī)載設(shè)備環(huán)境標(biāo)準(zhǔn)測試。
    的頭像 發(fā)表于 02-28 14:57 ?465次閱讀

    華為新增多項芯片制造設(shè)備及方法專利

    據(jù)這份專利陳述,其主題是關(guān)于晶圓處理設(shè)備及其操作方式。該設(shè)備包含晶圓載臺,其可沿旋轉(zhuǎn)軸線上進(jìn)行轉(zhuǎn)動;還有機(jī)械臂,其設(shè)有抓取晶圓的手部;此外還有一個控制器;
    的頭像 發(fā)表于 12-14 14:19 ?542次閱讀

    復(fù)旦科創(chuàng)母基金啟動,首期規(guī)模10

    據(jù)復(fù)旦大學(xué)消息,復(fù)旦科創(chuàng)母基金將注重長期,推動創(chuàng)新突破,以國家重點領(lǐng)域和上海重點產(chǎn)業(yè)戰(zhàn)略部署為牽引,聚焦集成電路,人工智能,生物醫(yī)藥,新材料等關(guān)鍵“卡脖子”領(lǐng)域。健全機(jī)制,集聚創(chuàng)新資源,充分發(fā)揮戰(zhàn)略科委決策功能
    的頭像 發(fā)表于 12-05 10:30 ?464次閱讀

    阿里云通義千問720參數(shù)模型宣布開源

    12月1日,阿里云通義千問720參數(shù)模型Qwen-72B宣布開源。與此同時,他們還開源18
    的頭像 發(fā)表于 12-01 17:08 ?1250次閱讀

    浪潮信息發(fā)布源2.0基礎(chǔ)大模型,千億參數(shù)全面開源

    11月27日,浪潮信息發(fā)布"源2.0"基礎(chǔ)大模型,并宣布全面開源。源2.0基礎(chǔ)大模型包括1026、518、21等三種參數(shù)規(guī)模的模型,在
    的頭像 發(fā)表于 11-28 09:10 ?744次閱讀
    浪潮信息發(fā)布源2.0基礎(chǔ)大模型,千億<b class='flag-5'>參數(shù)</b>全面<b class='flag-5'>開源</b>

    校源行 | 開放原子校源行活動走進(jìn)復(fù)旦大學(xué)

    更大的實踐舞臺,培養(yǎng)更多的開源綜合型人才,拓展開源貢獻(xiàn)新領(lǐng)域,推動開源科研成果高效轉(zhuǎn)化。 11月14日,開放原子校源行復(fù)旦大學(xué)破冰活動在復(fù)旦
    的頭像 發(fā)表于 11-16 21:20 ?952次閱讀
    校源行 | 開放原子校源行活動走進(jìn)<b class='flag-5'>復(fù)旦</b>大學(xué)

    緯鋰能獲得多項國際認(rèn)證

    創(chuàng)新實力及技術(shù)沉淀,緯鋰能已獲得多項國際認(rèn)證:2021年5月通過歐洲汽車工業(yè)協(xié)會信息安全最高等級TISAX評估
    的頭像 發(fā)表于 11-11 09:42 ?764次閱讀