0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

斯坦福團(tuán)隊(duì)抄襲國產(chǎn)大模型,主要責(zé)任人失聯(lián)

Felix分析 ? 來源:電子發(fā)燒友 ? 作者:吳子鵬 ? 2024-06-05 00:10 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的Llama3-V開源模型被證實(shí)套殼抄襲國內(nèi)清華與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5。該事件引起了業(yè)界的廣泛關(guān)注,也讓大家對于開源大模型的規(guī)范使用更加擔(dān)憂。

斯坦福Llama3V模型被證實(shí)抄襲

5月29日,斯坦福大學(xué)的一個(gè)AI團(tuán)隊(duì)在Github等平臺(tái)發(fā)布了一款大模型,名為Llama3V,該模型的亮點(diǎn)是據(jù)稱只需要500美元就可以訓(xùn)練出一個(gè) SOTA多模態(tài)模型,模型效果可比肩GPT-4V、Gemini Ultra等大模型。

由于模型團(tuán)隊(duì)來自斯坦福,且效果描述非常吸引眼球,因此該模型很快在社交平臺(tái)發(fā)酵,推特上相關(guān)話題的瀏覽量超過了30萬,迅速?zèng)_到了Hugging Face首頁。

不過,有用戶很快發(fā)現(xiàn),Llama3-V大模型實(shí)際上是套殼面壁智能的MiniCPM-Llama3-V 2.5,但Llama3-V在發(fā)布信息中并沒有體現(xiàn)這一點(diǎn),且稱只是使用了MiniCPM-Llama3-V 2.5的tokenizer。但這一說法讓用戶很難認(rèn)同,隨后有用戶在Github頁面上指出了套殼的問題,但相關(guān)言論很快被斯坦福團(tuán)隊(duì)刪除。

該用戶非常不滿隨后到MiniCPM-Llama3-V 2.5頁面下重述了這一問題,并提醒面壁智能重視此事。面壁團(tuán)隊(duì)通過測試發(fā)現(xiàn),Llama3V與MiniCPM-Llama3-V 2.5在“胎記”般案例上的表現(xiàn)100%雷同,做實(shí)了斯坦福團(tuán)隊(duì)的抄襲行為。隨后,這一事件在國外媒體迅速發(fā)酵。

隨后不久,斯坦福Llama3-V團(tuán)隊(duì)承認(rèn)抄襲,斯坦福本科生Siddharth Sharma和Aksh Garg發(fā)布了道歉聲明,不過據(jù)稱是主要責(zé)任人的Mustafa Aljadery并沒有出現(xiàn)在道歉聲明中,這名學(xué)生來自南加利福尼亞大學(xué),目前處于失蹤的狀態(tài),是這一事件的主要過錯(cuò)方。

Aksh Garg在道歉聲明中表示,“首先,我們要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa一起發(fā)布了Llama3-V,Mustafa為這個(gè)項(xiàng)目編寫了代碼,但從昨天起就無法聯(lián)系他。我與Siddharth Sharma主要負(fù)責(zé)幫助Mustafa進(jìn)行模型推廣。我們倆查看了最新的論文,以驗(yàn)證這項(xiàng)工作的新穎性,但并未被告知或意識到OpenBMB(清華團(tuán)隊(duì)支持發(fā)起的大規(guī)模預(yù)訓(xùn)練語言模型庫與相關(guān)工具)之前的任何工作。我們向作者道歉,并對自己沒有努力驗(yàn)證這項(xiàng)工作的原創(chuàng)性感到失望。我們對所發(fā)生的事情承擔(dān)全部責(zé)任,并已撤下Llama3-V,再次致歉?!?br />
6月3日,面壁智能CEO李大海與聯(lián)合創(chuàng)始人劉知遠(yuǎn)先后發(fā)文,回應(yīng)開源模型被斯坦福大學(xué)AI團(tuán)隊(duì)抄襲一事。李大海表示:“我們對這件事深表遺憾。一方面感慨這也是一種受到國際團(tuán)隊(duì)認(rèn)可的方式,另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境?!薄拔覀兿M麍F(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式?!?br />
據(jù)介紹,MiniCPM-Llama3-V 2.5是MiniCPM-V系列的最新版本模型,基于SigLip-400M和Llama3-8B-Instruct構(gòu)建,共參數(shù)規(guī)模為8B,相較于MiniCPM-V 2.0性能取得較大幅度提升。MiniCPM-Llama3-V 2.5在綜合了11個(gè)主流多模態(tài)大模型評測基準(zhǔn)的OpenCompass榜單上平均得分65.1的成績,超越了GPT-4o、GPT-4V、Gemini Pro、Qwen-VL-Max等商用閉源模型。

開源大模型規(guī)范使用值得關(guān)注

開源大模型是指一種基于開源技術(shù)和大規(guī)模數(shù)據(jù)集構(gòu)建的人工智能模型,具有開放性和可擴(kuò)展性的特點(diǎn)。開源大模型與傳統(tǒng)的商業(yè)人工智能模型不同,其最大的特點(diǎn)在于開放性和可擴(kuò)展性。這種模型的構(gòu)建需要利用大量的開源工具和資源,包括開源的深度學(xué)習(xí)框架、開源的數(shù)據(jù)集和開源的算法等。

開源大模型是AI大模型發(fā)展的重要分支,擁有LLaMA、Grok-1、Stable Code Instruct-3B、Mistral 8x7B和零一萬物的Yi-34B等代表產(chǎn)品,這些大模型的發(fā)布和發(fā)展,不僅顯著增強(qiáng)了數(shù)據(jù)的安全性和隱私保護(hù),更為用戶節(jié)省了大量成本,減少了對外部依賴的需求。

不過,由于是開源的,因此開源大模型一直以來都面臨著被抄襲的風(fēng)險(xiǎn)。實(shí)際上,上述提到的零一萬物的Yi-34B在去年也是深陷抄襲的漩渦里。2023年11月14日,一位國外開發(fā)者在Hugging Face開源主頁上評論稱,創(chuàng)新工場董事長兼CEO、零一萬物CEO李開復(fù)旗下 AI 公司“零一萬物”開源大模型Yi-34B,完全使用Meta研發(fā)的LIama開源模型架構(gòu),而只對兩個(gè)張量(Tensor)名稱進(jìn)行修改。

根據(jù)零一萬物的說明,零一萬物在訓(xùn)練模型過程中,沿用了GPT/LLaMA的基本架構(gòu),由于LLaMA社區(qū)的開源貢獻(xiàn),讓零一萬物可以快速起步。零一萬物還在聲明中稱,模型結(jié)構(gòu)僅是模型訓(xùn)練其中一部分。Yi 開源模型在其他方面的精力,比如數(shù)據(jù)工程、訓(xùn)練方法、baby sitting(訓(xùn)練過程監(jiān)測)的技巧、hyperparameter設(shè)置、評估方法以及對評估指標(biāo)的本質(zhì)理解深度、對模型泛化能力的原理的研究深度、行業(yè)頂尖的AI infra能力等。

實(shí)際上,在更早的2022年,智源研究院的大模型研究中心就被爆出了抄襲的問題,一篇擁有100位作者署名的綜述研究《A Roadmap for Big Model》被質(zhì)疑抄襲了多篇論文內(nèi)容,引發(fā)國內(nèi)外學(xué)者和社區(qū)的廣泛關(guān)注與討論。另外,商湯、谷歌等公司都曾被指出存在抄襲問題。

目前,AI大模型在防止抄襲、版權(quán)歸屬等問題方面還存在很大的漏洞,行業(yè)法規(guī)明顯不健全,關(guān)于大模型使用已有作品進(jìn)行訓(xùn)練是否構(gòu)成侵權(quán),以及大模型生成物是否可以享有版權(quán),這類事件也已經(jīng)有案件發(fā)生。相信隨著行業(yè)的進(jìn)一步發(fā)展,杜絕抄襲和版權(quán)歸屬將逐漸有法可依,這樣會(huì)更有利于大模型的發(fā)展。

結(jié)語

斯坦福團(tuán)隊(duì)開源大模型抄襲事件暴露了開源大模型的濫用和監(jiān)管問題,同時(shí)AI大模型也還有更深層次的數(shù)據(jù)和作品版權(quán)歸屬問題,因此不難看出AI大模型尚處于野蠻生長的階段,未來還需要逐步健全行業(yè)法規(guī)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2204

    瀏覽量

    2227
收藏 人收藏

    評論

    相關(guān)推薦

    國產(chǎn)儀器崛起:斯坦福替代方案來了!

    眾所周知,斯坦福的東西一直以來,好用,貴,貨期長動(dòng)輒幾個(gè)月,很苦惱 今天,他來了,他的替代來了 首先是最經(jīng)典的型號斯坦福SR830,它的頻率可以達(dá)到102.4 kHz ,18位的ADC,采樣率可以
    的頭像 發(fā)表于 07-10 17:05 ?259次閱讀
    <b class='flag-5'>國產(chǎn)</b>儀器崛起:<b class='flag-5'>斯坦福</b>替代方案來了!

    斯坦福大學(xué)研發(fā)全新AI輔助全息成像技術(shù)

    據(jù)最新消息,斯坦福大學(xué)的研究人員成功研制出全新AI輔助全息成像技術(shù),其薄度、重量及質(zhì)量均超過了當(dāng)前方案,有望推動(dòng)增強(qiáng)現(xiàn)實(shí)(AR)眼鏡領(lǐng)域的發(fā)展。
    的頭像 發(fā)表于 05-10 14:48 ?503次閱讀

    斯坦福發(fā)布《2024 AI指數(shù)報(bào)告》

    近日,斯坦福大學(xué)以人為本人工智能研究所(StanfordHAI)發(fā)布了《2024年人工智能指數(shù)報(bào)告》(ArtificialIntelligenceIndexReport2024)。據(jù)
    的頭像 發(fā)表于 04-18 08:28 ?712次閱讀
    <b class='flag-5'>斯坦福</b>發(fā)布《2024 AI指數(shù)報(bào)告》

    15 張圖,看懂人工智能現(xiàn)狀

    了一系列總結(jié)人工智能當(dāng)前狀態(tài)的圖表。今年的報(bào)告由斯坦福以人為中心的人工智能研究所(HAI)發(fā)布,增加了有關(guān)負(fù)責(zé)任人工智能的擴(kuò)展章節(jié)和有關(guān)
    的頭像 發(fā)表于 04-17 08:28 ?653次閱讀
    15 張圖,看懂人工智能現(xiàn)狀

    斯坦福、伯克利大神教授創(chuàng)業(yè)給機(jī)器人造大腦,OpenAI紅杉搶著投5億

    還記得曾火遍全網(wǎng)的ALOHA家務(wù)機(jī)器人嗎?最近該項(xiàng)目導(dǎo)師,斯坦福計(jì)算機(jī)科學(xué)與電氣工程系教授ChelseaFinn在X宣布,正式與其他幾位伯克利大牛學(xué)者、谷歌DeepMind科學(xué)家共同創(chuàng)業(yè),全力為
    的頭像 發(fā)表于 04-14 08:04 ?135次閱讀
    <b class='flag-5'>斯坦福</b>、伯克利大神教授創(chuàng)業(yè)給機(jī)器人造大腦,OpenAI紅杉搶著投5億

    SRS斯坦福850~鎖相放大器維修

    放大器示波器儀器儀表
    安泰儀器維修
    發(fā)布于 :2024年03月25日 10:40:48

    MCSDK 5.2電機(jī)啟動(dòng)后經(jīng)常導(dǎo)致串口聯(lián)的原因有哪些?

    我用5.2的庫生成的FOC程序?qū)﹄姍C(jī)進(jìn)行控制,上電后通過workbench 控制電機(jī),正常啟動(dòng)電機(jī)后,串口會(huì)聯(lián),電機(jī)還保持著聯(lián)前的狀態(tài)轉(zhuǎn)動(dòng)
    發(fā)表于 03-15 06:37

    英偉達(dá)CEO黃仁勛建議應(yīng)屆畢業(yè)生降低期望

    確實(shí),像斯坦福這類精英學(xué)校的學(xué)生,他們對未來的期待可能高于一般的應(yīng)屆畢業(yè)生。根據(jù)QS世界大學(xué)排名,斯坦福是美國第三好的大學(xué),學(xué)生需要支付昂貴的學(xué)費(fèi)——每年62484美元,而全美的平均學(xué)費(fèi)僅為26027美元。
    的頭像 發(fā)表于 03-14 16:22 ?617次閱讀

    斯坦福繼Flash Attention V1和V2又推出Flash Decoding

    斯坦福大學(xué)此前提出的FlashAttention算法,能夠在BERT-large訓(xùn)練中節(jié)省15%,將GPT訓(xùn)練速度提高2/3。
    的頭像 發(fā)表于 03-13 15:23 ?671次閱讀

    英偉達(dá)CEO黃仁勛:競爭對手的芯片免費(fèi)也難以比肩英偉達(dá)GPU

    根據(jù)斯坦福經(jīng)濟(jì)政策研究所在會(huì)上發(fā)布的視頻,美國斯坦福大學(xué)Charles R. Schwab榮譽(yù)經(jīng)濟(jì)學(xué)教授John Shoven向黃仁勛提問: “貴公司是否能造出最尖端的芯片?
    的頭像 發(fā)表于 03-11 10:08 ?550次閱讀

    NVIDIA首席科學(xué)家Bill Dally:深度學(xué)習(xí)硬件趨勢

    Bill Dally于2009年1月加入NVIDIA擔(dān)任首席科學(xué)家,此前在斯坦福大學(xué)任職12年,擔(dān)任計(jì)算機(jī)科學(xué)系主任。Dally及其斯坦福團(tuán)隊(duì)開發(fā)了系統(tǒng)架構(gòu)、網(wǎng)絡(luò)架構(gòu)、信號傳輸、路由和同步技術(shù),在今天的大多數(shù)大型并行計(jì)算機(jī)中都可
    的頭像 發(fā)表于 02-25 16:16 ?958次閱讀
    NVIDIA首席科學(xué)家Bill Dally:深度學(xué)習(xí)硬件趨勢

    安波國產(chǎn)系統(tǒng)級芯片艙行泊融合系統(tǒng)亮相CES 2024

    昨天,我們帶來了在CES 2024上全新亮相的“安波國產(chǎn)系統(tǒng)級芯片艙行泊融合系統(tǒng)”。今日繼續(xù)介紹閃耀拉斯維加斯的“中國芯”——由中國本土團(tuán)隊(duì)主導(dǎo)開發(fā)、搭載了國內(nèi)首顆一體式集成雷達(dá)芯片的安波
    的頭像 發(fā)表于 01-11 11:36 ?1001次閱讀

    維修斯坦福SR560可編程濾波器燒了overload

    近日某院校送修一臺(tái)斯坦福可編程濾波器SR560,客戶反饋儀器燒了 overload,對儀器進(jìn)行初步檢測,確定與客戶描述故障一致。本期將為大家分享本維修案例。 下面就是斯坦福-SR560維修情況
    的頭像 發(fā)表于 01-09 15:58 ?382次閱讀
    維修<b class='flag-5'>斯坦福</b>SR560可編程濾波器燒了overload

    斯坦福超火機(jī)器人團(tuán)隊(duì)自曝“丑聞”:Mobile ALOHA并不完美

    洞見分析
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月08日 11:50:46

    SR830數(shù)字鎖相放大器維修顯示OVERLOAD

    近日某院校送修一臺(tái)斯坦福數(shù)字鎖相放大器SR830,客戶反饋上顯示OVERLOAD,對儀器進(jìn)行初步檢測,確定與客戶描述故障一致。本期將為大家分享本維修案例。
    的頭像 發(fā)表于 12-05 16:02 ?664次閱讀
    SR830數(shù)字鎖相放大器維修顯示OVERLOAD