国产精品拍自网站资源多,欧美性猛交xxxx富婆

1月17日，商湯科技與上海AI實驗室聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)正式發(fā)布新一代大語言模型書?·浦語2.0（InternLM2）。

InternLM2 的核心理念在于回歸語言建模的本質(zhì)，致力于通過提高語料質(zhì)量及信息密度，實現(xiàn)模型基座語言建模能力質(zhì)的提升，進(jìn)而在數(shù)理、代碼、對話、創(chuàng)作等各方面都取得長足進(jìn)步，綜合性能達(dá)到開源模型的領(lǐng)先水平。

InternLM2是在2.6萬億token的高質(zhì)量語料上訓(xùn)練得到的。沿襲第一代書生·浦語（InternLM）設(shè)定，InternLM2包含7B及20B兩種參數(shù)規(guī)格及基座、對話等版本，滿足不同復(fù)雜應(yīng)用場景需求，繼續(xù)開源，提供免費商用授權(quán)。

回歸語言建模本質(zhì)

筑牢大模型能力基礎(chǔ)

大模型的研究應(yīng)回歸語言建模本質(zhì)，大模型各項性能提升的基礎(chǔ)在于語言建模能力的增強。

為此，聯(lián)合團(tuán)隊提出了新一代的數(shù)據(jù)清洗過濾技術(shù)，通過更高質(zhì)量的語料及更高的信息密度，筑牢大模型能力基礎(chǔ)。

主要發(fā)展了以下幾個方面的技術(shù)方法：

多維度數(shù)據(jù)價值評估：基于文本質(zhì)量、信息質(zhì)量、信息密度等維度對數(shù)據(jù)價值進(jìn)行綜合評估與提升。

高質(zhì)量語料驅(qū)動的數(shù)據(jù)富集：利用高質(zhì)量語料的特征從物理世界、互聯(lián)網(wǎng)以及語料庫中進(jìn)一步富集類似語料。

針對性的數(shù)據(jù)補齊：針對性補充語料，重點加強現(xiàn)實世界知識、數(shù)理、代碼等核心能力。

目前，浦語背后的數(shù)據(jù)清洗過濾技術(shù)已經(jīng)歷三輪迭代升級。僅使用約60%的訓(xùn)練數(shù)據(jù)即可達(dá)到使用第二代數(shù)據(jù)訓(xùn)練1T tokens的性能表現(xiàn)，模型訓(xùn)練效率大幅提升。

第三代數(shù)據(jù)清洗過濾技術(shù)大幅度提升模型訓(xùn)練效率

基于第三代數(shù)據(jù)清洗過濾技術(shù)，InternLM2語言建模能力實現(xiàn)了顯著增強。

與第一代InternLM相比，InternLM2在大規(guī)模高質(zhì)量的驗證語料上的Loss分布整體左移，表明其語言建模能力實質(zhì)性增強

支持200K超長上下文

“大海撈針”近乎完美

長語境輸入及理解能力能夠顯著拓展大模型應(yīng)用場景，比如支持大型文檔處理、復(fù)雜的推理演算和實際場景的工具調(diào)用等。然而，大模型有限的上下文長度當(dāng)前仍是學(xué)界及業(yè)內(nèi)面臨的重要難題。

通過拓展訓(xùn)練窗口大小和位置編碼改進(jìn)，InternLM2支持20萬 tokens的上下文，能夠一次性接受并處理約30萬漢字（約五六百頁的文檔）的輸入內(nèi)容，準(zhǔn)確提取關(guān)鍵信息，實現(xiàn)長文本中“大海撈針”。

參考業(yè)界范例，研究人員對InternLM2進(jìn)行了“大海撈針”試驗：將關(guān)鍵信息隨機(jī)插入一段長文本的不同位置并設(shè)置問題，測試模型能否從中提取出關(guān)鍵信息。

InternLM2“大海撈針”試驗效果

上圖展示了InternLM2在不同長度的上下文（橫軸）及上下文中不同位置（縱軸）上召回關(guān)鍵信息的準(zhǔn)確率（Recall）。紅色代表較低的召回準(zhǔn)確率，而綠色則代表較高的召回率。試驗結(jié)果表明，InternLM2在上下文長度延展到200K時依舊保持了近乎完美的召回成功率，驗證了InternLM2對于超長上下文堅實的支持能力。

為測試InternLM2在真實長文本處理任務(wù)中的能力，研究人員將一份時長3小時的公開會議錄音轉(zhuǎn)錄稿輸入模型中，并要求InternLM2從中提取出關(guān)鍵信息。

InternLM2準(zhǔn)確總結(jié)“聯(lián)合國2023年10月2日召開的聯(lián)合國貿(mào)易和發(fā)展會議會議記錄”

原始公開記錄詳見：

https://conf.unog.ch/digitalrecordings/index.html?guid=public/60.5295/9849DF25-F3B5-4BFF-8979-C5A989586205_10h09&position=0&channel=ORIGINAL

測試結(jié)果表明，盡管在未校對的文本中存在較多錯別字，但I(xiàn)nternLM2仍從中準(zhǔn)確提煉出了關(guān)鍵信息，并總結(jié)了關(guān)鍵發(fā)言人的觀點。

性能全面提升

綜合領(lǐng)先同量級開源模型

InternLM2的各項能力獲得全面進(jìn)步，相比于初代InternLM，在推理、數(shù)學(xué)、代碼等方面的能力提升尤為顯著，綜合能力領(lǐng)先于同量級開源模型。

根據(jù)大語言模型的應(yīng)用方式和用戶關(guān)注的重點領(lǐng)域，研究人員定義了語言、知識、推理、數(shù)學(xué)、代碼、考試等六個能力維度，在55個主流評測集上對多個同量級模型的表現(xiàn)進(jìn)行了綜合評測。

評測結(jié)果顯示，InternLM2的輕量級及中量級版本性能在同量級模型中表現(xiàn)優(yōu)異。

InternLM2的輕量級及中量級版本性能在同量級開源模型中表現(xiàn)優(yōu)異

下面表格對比了InternLM2各版本與ChatGPT（GPT-3.5）以及GPT-4在典型評測集上的表現(xiàn)。

InternLM2與ChatGPT的評測結(jié)果對比

可以看到，InternLM2只用20B參數(shù)的中等規(guī)模，即在整體表現(xiàn)上達(dá)到了與ChatGPT比肩的水平。其中，在AGIEval、 BigBench-Hard（BBH）、GSM8K、MATH等對推理能力有較高要求的評測上，InternLM2表現(xiàn)甚至優(yōu)于ChatGPT。

與此同時，綜合性能的增強，帶來了下游任務(wù)的全方位能力提升。新發(fā)布的InternLM2提供優(yōu)秀的對話及創(chuàng)作體驗，支持多輪任務(wù)規(guī)劃及工具調(diào)用，并提供實用的數(shù)據(jù)分析能力。

對話及創(chuàng)作：更溫情、更富想象力

InternLM2不僅在客觀性能指標(biāo)上提升顯著，在主觀體驗上也有明顯改善，可以為用戶提供優(yōu)秀的對話和交互體驗。

研究測試表明，InternLM2-Chat可以精準(zhǔn)地理解和遵循用戶意圖，具備較強的共情能力和豐富的結(jié)構(gòu)化創(chuàng)作能力。

下面是幾個示例：

示例一：在嚴(yán)格格式要求下編制課程大綱

InternLM2設(shè)計的課程大綱精準(zhǔn)遵循用戶要求（比如格式、數(shù)量、內(nèi)容等）

示例二：以富有人文關(guān)懷的回答開解用戶

InternLM2能夠在對話中與用戶“共情”

示例三：展開想象力，編寫《流浪地球3》的劇本

InternLM2設(shè)計的具備充滿豐富的合理想象，比如外星遺跡、量子糾纏的引入等。同時整個故事表現(xiàn)了人類面對危機(jī)時的勇氣和團(tuán)結(jié)精神

對話和創(chuàng)造的體驗進(jìn)步的原因，一方面是基礎(chǔ)語言能力的顯著增強，另一方面也得益于微調(diào)技術(shù)的提升。

InternLM2進(jìn)行微調(diào)的過程使用了經(jīng)過第三代數(shù)據(jù)清洗過濾技術(shù)處理的指令微調(diào)語料，同時也采用了更強的Online RLHF。

研究人員在微調(diào)InternLM2的過程中，對獎勵模型和對話模型進(jìn)行了三輪迭代更新，每一輪更新均針對前一輪模型的表現(xiàn)更新偏好數(shù)據(jù)與提示詞。

在獎勵模型訓(xùn)練（RM）和近端策略優(yōu)化（PPO）階段，研究人員均衡采用各類提示詞，不僅提高了對話的安全性，也提升了用戶體驗。

工具調(diào)用：能力升級，更精準(zhǔn)的工具選用，更可靠的多步規(guī)劃

基于更強大、更具泛化性的指令理解、工具篩選與結(jié)果反思等能力，InternLM2可支持復(fù)雜智能體的搭建，支持對工具進(jìn)行多輪有效調(diào)用及多步驟規(guī)劃，完成復(fù)雜任務(wù)。

聯(lián)合團(tuán)隊針對多種任務(wù)構(gòu)建了細(xì)粒度工具調(diào)用評測集T-Eval（https://open-compass.github.io/T-Eval），InternLM2-Chat-7B在該評測集上表現(xiàn)超越了Claude-2.1和目前的開源模型，性能接近GPT-3.5。

InternLM2工具調(diào)用能力全面提升

通過工具調(diào)用，使得大語言模型可通過搜索、計算、代碼解釋器等獲取知識并處理更復(fù)雜的問題，從而拓展應(yīng)用邊界。研究人員對模型調(diào)用工具流程實施細(xì)粒度的拆解和分析，針對規(guī)劃、推理、工具選擇、理解、執(zhí)行、反思等步驟進(jìn)行了針對性增強和優(yōu)化。

基于InternLM2通過開源智能體框架Lagent搭建的用戶助手智能體，能夠在一次指令回應(yīng)中完成地圖查詢、路線規(guī)劃、發(fā)郵件等任務(wù)

數(shù)理推理：會做題，還會可視化分析

數(shù)學(xué)能力是大模型邏輯思維和推理能力的重要體現(xiàn)。

InternLM2的數(shù)學(xué)能力全面提升，達(dá)到當(dāng)前開源模型的標(biāo)桿水平。

基于更加科學(xué)構(gòu)建的預(yù)訓(xùn)練語料，InternLM2形成了很強的內(nèi)生計算能力。

在不依靠計算器等外部工具的情況下，在100以內(nèi)的簡單數(shù)學(xué)運算上能夠做到接近100%的準(zhǔn)確率，在1000以內(nèi)達(dá)到80%左右的運算準(zhǔn)確率。在GSM8K和MATH評測中，InternLM2-20B的表現(xiàn)超過了ChatGPT（GPT-3.5）。

InternLM2在100以內(nèi)的簡單數(shù)學(xué)運算上能夠做到接近100%的準(zhǔn)確率

為應(yīng)對各類復(fù)雜計算，InternLM2-Chat還可借助代碼解釋器（Code-Interpreter）編寫代碼進(jìn)行計算，或?qū)ν评淼慕Y(jié)果進(jìn)行形式化驗證，從而解決計算要求更高或者演算過程更加復(fù)雜的問題。

在典型的數(shù)學(xué)評測集 GSM8K 和 MATH 上，配合代碼解釋器，InternLM2取得了更高的評測分?jǐn)?shù)。其中對于難度更高的 MATH 數(shù)據(jù)集，InternLM2的計算精度從 32.5 大幅提升到 51.2，甚至超過了 GPT-4 的表現(xiàn)。

下面示例展示了InternLM2可以和代碼解釋器結(jié)合解決較復(fù)雜的高等數(shù)學(xué)問題。

InternLM2能夠完成積分求解等高等數(shù)學(xué)題目

基于在計算及工具調(diào)用方面強大的基礎(chǔ)能力，InternLM2在語言模型中具備了數(shù)據(jù)分析和可視化實用能力，進(jìn)一步貼近用戶使用場景。

向InternLM2輸入國家統(tǒng)計局公布的“2023年3-11月份規(guī)模以上工業(yè)企業(yè)主要財務(wù)指標(biāo)（分行業(yè)）”，InternLM2能夠分析數(shù)據(jù)并繪制折線圖

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
29359

瀏覽量
267635
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
490

瀏覽量
10225
商湯科技

商湯科技

+關(guān)注

關(guān)注
8

文章
478

瀏覽量
36024

原文標(biāo)題：支持200K超長上下文，一次可讀30萬漢字，“書生·浦語”2.0正式開源

文章出處：【微信號：SenseTime2017，微信公眾號：商湯科技SenseTime】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聯(lián)發(fā)科新一代天璣旗艦芯片針對谷歌大語言模型Gemini Nano優(yōu)化

近日，聯(lián)發(fā)科宣布了一個重要的技術(shù)進(jìn)展——新一代天璣旗艦芯片已經(jīng)針對谷歌的大語言模型Gemini Nano進(jìn)行了深度優(yōu)化。

發(fā)表于 10-09 16:44 ?268次閱讀

DeepL推出新一代翻譯編輯大型語言模型

在人工智能與語言處理領(lǐng)域，DeepL再次以其創(chuàng)新實力引領(lǐng)潮流，宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語言模型。這一里程碑式的進(jìn)展，不僅鞏

發(fā)表于 07-19 15:56 ?532次閱讀

商湯科技與泰國DTGO集團(tuán)聯(lián)合發(fā)布泰語大模型

「日日新」出海了！ 7月10日，商湯聯(lián)合泰國DTGO集團(tuán)及旗下Quinnnova共同發(fā)布「東風(fēng)」泰語大模型?(DTLM)，成為全球首個能在泰文、中文、英文三種語言環(huán)境下高效工作的A

發(fā)表于 07-11 19:57 ?1027次閱讀

<b class='flag-5'>商湯</b>科技與泰國DTGO集團(tuán)聯(lián)合<b class='flag-5'>發(fā)布</b>泰語大<b class='flag-5'>模型</b>

商湯科技發(fā)布日日新5.5大模型體系

商湯科技近日震撼發(fā)布其最新的日日新5.5大模型體系，標(biāo)志著人工智能領(lǐng)域又邁出了堅實的一步。該體系以6000億參數(shù)的超大規(guī)?；A(chǔ)模型——日日新

發(fā)表于 07-08 15:05 ?476次閱讀

商湯科技發(fā)布“商量”粵語版大模型

商湯科技近日發(fā)布了針對粵語用戶量身定制的商量語言大模型和商量多模態(tài)大模型。這兩款模型即日起向企業(yè)

發(fā)表于 05-31 10:52 ?755次閱讀

商湯發(fā)布日日新大模型5.0粵語版

近日，人工智能領(lǐng)軍企業(yè)商湯科技正式對外發(fā)布了其最新研發(fā)成果——日日新大模型5.0粵語版。該模型針對粵語用戶進(jìn)行了深度優(yōu)化，旨在提供更精準(zhǔn)、更高效的自然

發(fā)表于 05-30 09:21 ?555次閱讀

商湯將發(fā)布日日新大模型5.0粵語版本

商湯科技即將迎來一項重要更新，他們將發(fā)布日日新大模型5.0的粵語版本。這一版本是基于商湯科技現(xiàn)有

發(fā)表于 05-08 09:33 ?428次閱讀

英特爾AI產(chǎn)品助力其運行Meta新一代大語言模型Meta Llama 3

英特爾豐富的AI產(chǎn)品——面向數(shù)據(jù)中心的至強處理器，邊緣處理器及AI PC等產(chǎn)品為開發(fā)者提供最新的優(yōu)化，助力其運行Meta新一代大語言模型Meta Llama 3

發(fā)表于 04-28 11:16 ?514次閱讀

上海AI實驗室發(fā)布新一代書生·視覺大模型

近日，上海人工智能實驗室（上海AI實驗室）聯(lián)手多所知名高校及科技公司共同研發(fā)出新一代書生·視覺大模型（InternVL）。

發(fā)表于 02-04 11:25 ?986次閱讀

商湯科技發(fā)布新版日日新·商量大語言模型

商湯科技近日發(fā)布了新版的日日新·商量大語言模型-通用版本（SenseChat V4）。這一版本的模型

發(fā)表于 02-04 10:30 ?860次閱讀

恩智浦發(fā)布新一代智能語音技術(shù)組合的語音識別引擎

恩智浦發(fā)布新一代智能語音技術(shù)組合的語音識別引擎。本文將探討開發(fā)人員在嵌入式語音控制設(shè)計中面臨的挑戰(zhàn)、恩智浦新的Speech to Intent引擎，以及您如何在應(yīng)用中使用它。

發(fā)表于 01-26 09:15 ?673次閱讀

書生?浦語 2.0（InternLM2）大語言模型開源

這個模型在 2.6 萬億 token 的高質(zhì)量語料基礎(chǔ)上進(jìn)行訓(xùn)練，包含 7B 和 20B 兩種參數(shù)規(guī)格以及基座、對話等版本，以滿足不同復(fù)雜應(yīng)用場景的需求。

發(fā)表于 01-19 09:39 ?241次閱讀

商湯科技聯(lián)合發(fā)布《新一代人工智能基礎(chǔ)設(shè)施白皮書》

近日，商湯科技智能產(chǎn)業(yè)研究院攜手中國信息通信研究院云計算與大數(shù)據(jù)研究所、中國智能算力產(chǎn)業(yè)聯(lián)盟以及人工智能算力產(chǎn)業(yè)生態(tài)聯(lián)盟，共同發(fā)布了《新一代人工智能基礎(chǔ)設(shè)施白皮書》（以下簡稱《白皮書》）。

發(fā)表于 01-03 14:28 ?720次閱讀

谷歌發(fā)布多模態(tài)Gemini大模型及新一代TPU系統(tǒng)Cloud TPU v5p

谷歌亦發(fā)布新一代TPU 系統(tǒng)——Cloud TPU v5p，以幫助訓(xùn)練尖端的 AI 模型。目

發(fā)表于 12-12 10:50 ?1235次閱讀

代碼小浣熊Raccoon上線，助你絲滑寫代碼，商湯大語言模型實力加持

基于商湯自研大語言模型的智能編程助手 —— 代碼小浣熊Raccoon ，即日起開放公測！

發(fā)表于 12-07 16:40 ?706次閱讀