LLM在生成摘要方面效果到底如何？

來源：公眾號機(jī)器之心授權(quán)

以后文本摘要總結(jié)任務(wù)，可以放心交給大模型了。

文本摘要，作為自然語言生成（NLG）中的一項任務(wù)，主要用來將一大段長文本壓縮為簡短的摘要，例如新聞文章、源代碼和跨語言文本等多種內(nèi)容都能用到。

隨著大模型（LLM）的出現(xiàn)，傳統(tǒng)的在特定數(shù)據(jù)集上進(jìn)行微調(diào)的方法已經(jīng)不在適用。

我們不禁會問，LLM 在生成摘要方面效果到底如何？

為了回答這一問題，來自北京大學(xué)的研究者在論文《 Summarization is (Almost) Dead 》中進(jìn)行了深入的探討。他們使用人類生成的評估數(shù)據(jù)集評估了 LLM 在各種摘要任務(wù)（單條新聞、多條新聞、對話、源代碼和跨語言摘要）上的表現(xiàn)。

在對 LLM 生成的摘要、人工撰寫的摘要和微調(diào)模型生成的摘要進(jìn)行定量和定性的比較后發(fā)現(xiàn)，由 LLM 生成的摘要明顯受到人類評估者的青睞。

接著該研究在對過去 3 年發(fā)表在 ACL、EMNLP、NAACL 和 COLING 上的 100 篇與摘要方法相關(guān)的論文進(jìn)行抽樣和檢查后，他們發(fā)現(xiàn)大約 70% 的論文的主要貢獻(xiàn)是提出了一種總結(jié)摘要方法并在標(biāo)準(zhǔn)數(shù)據(jù)集上驗證了其有效性。因此，本文表示「摘要（幾乎）已死（ Summarization is (Almost) Dead ）」。

盡管如此，研究者表示該領(lǐng)域仍然存在挑戰(zhàn)，例如需要更高質(zhì)量的參考數(shù)據(jù)集、改進(jìn)評估方法等還需要解決。

方法及結(jié)果

該研究使用最新的數(shù)據(jù)來構(gòu)建數(shù)據(jù)集，每個數(shù)據(jù)集由 50 個樣本組成。

例如在執(zhí)行單條新聞、多條新聞和對話摘要任務(wù)時，本文采用的方法模擬了 CNN/DailyMail 、Multi-News 使用的數(shù)據(jù)集構(gòu)建方法。對于跨語言摘要任務(wù)，其策略與 Zhu 等人提出的方法一致。關(guān)于代碼摘要任務(wù)，本文采用 Bahrami 等人提出的方法。

數(shù)據(jù)集構(gòu)建完成之后，接下來就是方法了。具體來說，針對單條新聞任務(wù)本文采用 BART 和 T5 ；多條新聞任務(wù)采用 Pegasus 和 BART；T5 和 BART 用于對話任務(wù)；跨語言任務(wù)使用 MT5 和 MBART ；源代碼任務(wù)使用 Codet5 。

實驗中，該研究聘請人類評估員來比較不同摘要的整體質(zhì)量。結(jié)果如圖 1 所示，LLM 生成的摘要在所有任務(wù)中始終優(yōu)于人工生成的摘要和微調(diào)模型生成的摘要。

這就提出了一個問題：為什么 LLM 能夠勝過人類撰寫的摘要，而傳統(tǒng)上人們認(rèn)為這些摘要是完美無缺的。此外，經(jīng)過初步的觀察表明，LLM 生成的摘要表現(xiàn)出高度的流暢性和連貫性。

本文進(jìn)一步招募注釋者來識別人類和 LLM 生成摘要句子中的幻覺問題，結(jié)果如表 1 所示，與 GPT-4 生成的摘要相比，人工書寫的摘要表現(xiàn)出相同或更高數(shù)量的幻覺。在多條新聞和代碼摘要等特定任務(wù)中，人工編寫的摘要表現(xiàn)出明顯較差的事實一致性。

人工撰寫的摘要和 GPT-4 生成摘要中出現(xiàn)幻覺的比例，如表 2 所示：

本文還發(fā)現(xiàn)人工編寫的參考摘要存在這樣一個問題，即缺乏流暢性。如圖 2 (a) 所示，人工編寫的參考摘要有時存在信息不完整的缺陷。并且在圖 2 (b) 中，一些由人工編寫的參考摘要會出現(xiàn)幻覺。

本文還發(fā)現(xiàn)微調(diào)模型生成的摘要往往具有固定且嚴(yán)格的長度，而 LLM 能夠根據(jù)輸入信息調(diào)整輸出長度。此外，當(dāng)輸入包含多個主題時，微調(diào)模型生成的摘要對主題的覆蓋率較低，如圖 3 所示，而 LLM 在生成摘要時能夠捕獲所有主題：

由圖 4 可得，人類對大模型的偏好分?jǐn)?shù)超過 50%，表明人們對其摘要有強(qiáng)烈的偏好，并凸顯了 LLM 在文本摘要方面的能力：

　　審核編輯：湯梓紅

閱讀全文

源代碼(65968) 源代碼(65968)
GPT(14803) GPT(14803)
大模型(810) 大模型(810)
LLM(229) LLM(229)

對比解碼在LLM上的應(yīng)用

為了改進(jìn)LLM的推理能力，University of California聯(lián)合Meta AI實驗室提出將Contrastive Decoding應(yīng)用于多種任務(wù)的LLM方法。實驗表明，所提方法能有效改進(jìn)LLM的推理能力。讓我們走進(jìn)論文一探究竟吧！

2023-09-21 11:37:55

327

TensorRT-LLM初探（一）運(yùn)行l(wèi)lama

TensorRT-LLM正式出來有半個月了，一直沒有時間玩，周末趁著有時間跑一下。

2023-11-16 17:39:34

772

低比特量化技術(shù)如何幫助LLM提升性能

針對大語言模型 (LLM) 在部署過程中的性能需求，低比特量化技術(shù)一直是優(yōu)化效果最佳的方案之一，本文將探討低比特量化技術(shù)如何幫助 LLM 提升性能，以及新版 OpenVINO 對于低比特量化技術(shù)的支持。

2023-12-08 15:26:45

554

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

在生成EXE后，運(yùn)行出現(xiàn)這個問題，求教大神指點(diǎn)是怎么原因，急急急?。。。?！

在生成EXE后，運(yùn)行出現(xiàn)這個問題，求教大神指點(diǎn)是怎么原因，急急急?。。。。∈裁磫栴}？如何解決？！

2015-06-19 17:21:32

在生成exe時報如下錯誤求助

`https://bbs.elecfans.com/forum.ph ... 7%94%9F%E6%88%90exe如題按照上面這個鏈接的步驟生成exe預(yù)覽的時候沒有報錯但是生成結(jié)果報如下錯誤

2015-11-19 09:38:41

在生成系統(tǒng)時run simulator時為什么出現(xiàn)the HDL simulator path is n...

在生成系統(tǒng)時runsimulator時為什么出現(xiàn)the HDL simulator path is not set.it can be set in the tools >options dialo怎么改

2014-08-13 17:59:28

生成應(yīng)用程序時目標(biāo)問題

在生成應(yīng)用程序時，我想要得到兩個單獨(dú)的文件夾，一個是data，另一個是gongyi，在生成頁中的目標(biāo)項，程序自動生成了支持目錄，我選擇添加，修改目標(biāo)標(biāo)簽為gongyi，預(yù)覽時還是只有一個data文件，我該怎么做？

2013-03-13 11:01:10

CC2541 oad 在生成ImageB.bin超過256k flash？

CC2541oad在生成ImageB.bin超過256k flash？那個大神用過cc2541的 oad功能嗎？？？在生成ImageB.bin時，ImageB.bin文件過大，超過

2016-03-16 14:56:17

LABview在生成表格的時候，如何同時給表格加密

用LABVIEW生成表格是很簡單的事情，但如果在生成表格的同時用LABVIEW給表格加密，然后繼續(xù)往這個表格里面寫數(shù)據(jù)，求問大神該怎么實現(xiàn)

2018-04-10 10:09:57

Labview項目依賴的類庫越多，生成EXE的時候越慢嗎？

同樣的項目框架，其中一個改用調(diào)用很多類庫的方式，另一個都是調(diào)用單獨(dú)的vi，類庫比較少。在生成EXE的時候，前者需要十幾分鐘，后者一分鐘之內(nèi)完成。是因為類庫太多的原因?qū)е?b class="flag-6" style="color: red">生成EXE變慢嗎？兩個項目其他方面差異比較小。

2022-07-15 11:06:50

Reset-Handler所需的.text空間是否在生成鏈接文件時預(yù)先計算并保留呢？

的地址可能已更改，并且啟動文件可能不正確?！癛eset-Handler”所需的“.text”空間是否在生成鏈接文件時預(yù)先計算并保留？或者它是一種迭代過程？gcc 工具鏈的哪個實例生成啟動文件？謝謝

2023-01-05 09:06:52

ad17生成pcb要注意那些方面？

生成pcb要注意那些方面

2017-03-03 09:31:38

labview在生成應(yīng)用程序之后無法運(yùn)行，但報錯終止之后可正常運(yùn)行，求大神解答?。。?！

labview在生成應(yīng)用程序之后無法運(yùn)行，運(yùn)行停止選項都是灰色的，沒辦法運(yùn)行，但是在出現(xiàn)意外報錯終止之后會顯示運(yùn)行按鈕，點(diǎn)擊可正常運(yùn)行，也就是說，我把報錯那一塊改對之后，怎么也運(yùn)行不了，求大神解答?。。?！

2016-01-22 08:36:59

labview中生成報表，運(yùn)行后，怎么一直在生成，停不下來

本帖最后由 elecfans跑堂于 2015-8-31 09:24 編輯 labview中生成excel報表，運(yùn)行后，怎么excel一直在生成，停不下來，求解

2015-08-31 08:49:00

labview怎么在修改項目子vi的時候?qū)崟r預(yù)覽項目生成效果，而不是每次生成EXE出來再看效果？？

labview怎么在修改項目子vi的時候?qū)崟r預(yù)覽項目生成效果，而不是每次生成EXE出來再看效果？？這樣有點(diǎn)麻煩。望大神告知謝謝??！

2018-12-28 17:30:44

labview無法生成應(yīng)用程序，添加源文件時顯示“錯誤生成預(yù)覽”

我在生成應(yīng)用程序后要生成安裝程序，如圖，在源文件設(shè)置里要將“我的應(yīng)用程序”添加到“目標(biāo)視圖”時，看到我的應(yīng)用程序下顯示錯誤生成預(yù)覽，結(jié)果到時添加后，在生成安裝程序時顯示發(fā)生未定義錯誤，致使安裝包無法正常生成。該問題是不是因為我在生成應(yīng)用程序時發(fā)生了錯誤？哪位大俠可告知一二，，萬分感激?。?/div>

2016-05-12 14:58:09

pic24f系列用mcc生成的i2c主機(jī)中斷程序怎么使用

在生成的i2c1.c文件中有幾個函數(shù)，利用中斷進(jìn)行讀寫從機(jī)，按照i2c1.h中的例子無論怎么改都不正確，每次都只能發(fā)送從機(jī)地址，既不能讀也不能寫。哪位成功過的朋友給講一下到底怎么回事

2017-04-20 18:10:01

為什么我的LabVIEW項目在生成EXE后有些界面的自定義菜單可以實現(xiàn)，有些卻不行呢？

為什么我的LabVIEW項目在生成EXE后有些界面的自定義菜單可以實現(xiàn)，有些卻不行呢？甚至有時候全部都不行了。但是在編輯模式下又是正常的，我感到很費(fèi)解啊~！

2016-01-15 16:49:29

在8168 DVR-RDK中,現(xiàn)在生成的.out 只可以在開發(fā)板上運(yùn)行的,怎么修改能夠生成可在linux的可調(diào)試程序?

本帖最后由一只耳朵怪于 2018-5-25 17:36 編輯在8168 DVR-RDK中,現(xiàn)在生成的.out 只可以在開發(fā)板上運(yùn)行的,怎么修改能夠生成可在linux的可調(diào)試程序?

2018-05-25 08:12:10

在quartus ii 中編寫一個程序在生成密封元件時會報錯

我有一個問題，在quartus ii 中編寫一個程序，它的輸出是自定義類型，編譯安全通過，為什么在生成密封元件時會報錯，說是不支持的類型。有沒有解決辦法。

2014-02-21 01:18:11

在做simulink+tasking自動代碼生成時，編譯找不到底層文件是為什么？

在做simulink+tasking自動代碼生成時，編譯找不到底層文件，將文件添加進(jìn)去后，會出現(xiàn)RT或NRT等重復(fù)定義

2024-02-20 08:06:38

如何配置RTR位以在生成的CAN_NODE_0中接收遠(yuǎn)程幀?

但我們無法在代碼中配置 RTR 位，能否請你解釋一下如何配置 RTR 位以在生成的 CAN_NODE_0 中接收遠(yuǎn)程幀。

2024-01-19 06:38:58

微波射頻在生活中的應(yīng)用有哪些方面？

　　微波射頻在生活中的應(yīng)用有哪些方面？　　1.網(wǎng)絡(luò)通信，信號覆蓋以及信息溝通?！　?.微波射頻能產(chǎn)生均勻的能量，也用于烹飪或者加熱食物　　3.因為微波射頻產(chǎn)生的能量可控，可用于穩(wěn)定照明?！　?.在人體健康方面也有相關(guān)應(yīng)用。

2022-03-30 13:51:57

想學(xué)HIFI，功放知識，效果器方面的知識想買個示波器，求推薦

2015-11-05 00:43:39

請問Y電容到底怎么接效果才是最好的？

Y電容，到底怎么接效果才是最好的？

2021-03-17 06:42:17

請問labview在生成exe時怎么讓啟動項的vi不運(yùn)行？

labview在生成exe時怎么讓啟動項的vi不運(yùn)行？

2018-12-14 11:16:06

請問為什么生成FFT ip 核會卡在生成這一步？

請問為什么生成FFT ip 核會卡在生成這一步，前兩天還好好的。求大神的解決辦法，網(wǎng)上實在找不到方法

2016-11-01 13:42:43

LuxStudio增材制造晶格模型自動生成平臺

LuxStudio增材制造晶格模型自動生成平臺｜LuxCreo目前，市面上大多數(shù)的晶格設(shè)計軟件幾乎都有局限性，比如晶格種類過少、生成的晶胞質(zhì)量本身有問題、效果不理想，另外軟件操作門檻較高等，種種弊端

2022-11-09 10:43:02

基于詞頻統(tǒng)計的多文檔自動摘要生成方案

多文檔自動摘要技術(shù)可以向用戶提供一個簡潔、全面的摘要信息，因此研究多文檔自動摘要技術(shù)具有很重要的意義。本文提出了一種上下文敏感的基于詞頻統(tǒng)計的多文檔自動摘要

2009-12-18 16:58:29

SVD的效果到底如何呢？

機(jī)器學(xué)習(xí)中常用的降維方法是主成分分析(PCA)，而主成分分析常用奇異值分解(SVD)。那么SVD的效果到底如何呢？SVD常用來進(jìn)行圖像的壓縮，我們就來實驗一下。

2017-02-11 17:19:13

1595

一種自動生成循環(huán)摘要的方法

中存放的新值來描述循環(huán)語句的執(zhí)行效果，并將該執(zhí)行效果定義為循環(huán)摘要，同時，提出一種自動生成循環(huán)摘要的方法，可以為操作常用數(shù)據(jù)結(jié)構(gòu)的循環(huán)自動生成循環(huán)摘要，包含嵌套循環(huán)．此外，基于循環(huán)摘要，可以自動生成循環(huán)語句

2017-12-29 11:12:57

電力通信模型自動生成方法及其優(yōu)化

網(wǎng)絡(luò)中的脆弱節(jié)點(diǎn)進(jìn)行補(bǔ)強(qiáng)。仿真實驗結(jié)果顯示這種結(jié)合K-means和脆弱性分析的拓?fù)?b class="flag-6" style="color: red">生成算法在生成對意外風(fēng)險具有較強(qiáng)抗性的電力網(wǎng)絡(luò)拓?fù)?b class="flag-6" style="color: red">方面具有比較好的效果。

2018-02-02 17:05:55

生成英文維基百科文章的方法可以概述為源文檔的多文檔摘要

最近，經(jīng)過研究證明，生成英文維基百科（English Wikipedia）文章的方法可以概述為源文檔的多文檔摘要。我們使用抽取式文摘（extractive summarization）來粗略地識別

2018-02-06 11:26:27

5775

如何運(yùn)行內(nèi)存接口生成器GUI以生成RTL

通過使用流量生成器創(chuàng)建示例設(shè)計，運(yùn)行綜合和實現(xiàn)以及查看摘要報告（利用率，功率等），了解如何運(yùn)行內(nèi)存接口生成器（MIG）GUI以生成RTL和約束文件

2018-11-23 06:16:00

4038

GAN在圖像生成應(yīng)用綜述

GAN 可以將任意的分布作為輸入，這里的 Z 就是輸入，在實驗中我們多取Z～N(0,1)，也多取 [?1,1] 的均勻分布作為輸入。生成器 G 的參數(shù)為 θ，輸入 Z 在生成器下得到 G(z;θ)，輸出可以被視為從分布中抽取的樣本 G(z;θ)～Pg。

2019-02-13 13:59:47

5251

關(guān)于如何控制變量在生成代碼里的作用分析和介紹

這樣在生成代碼的時候，參數(shù)p1就會定義為int32的數(shù)據(jù)類型，并且聲明為extern。而且它的聲明和定義代碼會分別寫入myHdr.h以及mySrc.c。

2019-09-17 16:18:40

2566

Python特征生成作用和生成的方法

的，好的特征可以顯著地提升模型效果。這意味著通過特征生成（即從數(shù)據(jù)設(shè)計加工出模型可用特征），是特征工程相當(dāng)關(guān)鍵的一步。本文從特征生成作用、特征生成的方法（人工設(shè)計、自動化特征生成）展開闡述并附上代碼。 1 特征生成的作用 ?

2021-03-10 15:53:42

1860

基于圖集成模型的自動摘要生產(chǎn)方法

現(xiàn)有長文本自動摘要生成方法存在句子特征單一化和無法全面衡量句子相似特征的問題，導(dǎo)致摘要生成的準(zhǔn)確率降低。為此，提岀一種基于圖集成模型的自動摘要生成方法。在計算得到文本句子詞頻、語義和句法特征后，利用

2021-03-22 14:40:16

基于關(guān)鍵字的自定義古詩句生成設(shè)計與實現(xiàn)

當(dāng)前，古詩勺生成任務(wù)大多基于單一的循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN結(jié)構(gòu)，在生成時需事先給定一個起始字然后以該起始字為基礎(chǔ)進(jìn)行古詩勺生成，生成過程的可控性較差，往往達(dá)不到預(yù)期效果。針對以上問題，將注意力機(jī)制引入

2021-04-12 15:30:57

融合文本分類和摘要的多任務(wù)學(xué)習(xí)摘要模型

文本摘要應(yīng)包含源文本中所有重要信息，傳統(tǒng)基于編碼器-解碼器架構(gòu)的摘要模型生成的摘要準(zhǔn)確性較低。根據(jù)文本分類和文本摘要的相關(guān)性，提出一種多任務(wù)學(xué)習(xí)摘要模型。從文本分類輔助任務(wù)中學(xué)習(xí)抽象信息改善摘要生成

2021-04-27 16:18:58

基于語義感知的中文短文本摘要生成技術(shù)

文本摘要生成技術(shù)能夠從海量數(shù)據(jù)中概括岀關(guān)鍵信息，有效解決用戶信息過載的問題。目前序列到序列模型被廣泛應(yīng)用于英文文本摘要生成領(lǐng)域，而在中文文本摘要生成領(lǐng)域沒有對該模型進(jìn)行深λ硏究。對于傳統(tǒng)的序列到序列

2021-05-28 15:45:25

基于Patent-Rank的中文專利摘要生成算法

文本摘要任務(wù)旨在通過對原文進(jìn)行壓縮提煉，得出簡明扼要的內(nèi)容描述。針對中文專利文本，提出了一種基于 PatentRank算法生成專利摘要的算法。首先，對候選勺群做冗余處理，以去除候選勺群中相似度較高

2021-06-15 17:03:06

受控文本生成模型的一般架構(gòu)及故事生成任務(wù)等方面的具體應(yīng)用

任務(wù)和常識生成任務(wù)上的具體應(yīng)用，指出了受控文本生成技術(shù)在具體應(yīng)用場景下的改進(jìn)方向。 0. 什么是受控文本生成文本生成任務(wù)是自然語言處理領(lǐng)域十分重要的一類任務(wù)。文本摘要、語法糾錯、人機(jī)對話等很多自然語言處理任務(wù)都可

2021-10-13 09:46:39

3033

生成式摘要的經(jīng)典模型

以往的標(biāo)題模型產(chǎn)生的都是平實性標(biāo)題，即簡單語言描述的事實性標(biāo)題。但是，實際上我們可能更需要有記憶點(diǎn)的爆款標(biāo)題來增加點(diǎn)擊量/曝光率。因此，衍生出了一個新任務(wù)——帶有風(fēng)格的標(biāo)題生成，即 Stylistic Headline Generation，簡稱 SHG 。

2022-07-08 17:04:49

1835

摘要模型理解或捕獲輸入文本的要點(diǎn)

Abstract Intro ? 盡管基于預(yù)訓(xùn)練的語言模型的摘要取得了成功，但一個尚未解決的問題是生成的摘要并不總是忠實于輸入文檔。造成不忠實問題的原因可能有兩個： ? （1）摘要模型未能理解或捕獲

2022-11-01 11:37:57

692

如何利用LLM做多模態(tài)任務(wù)？

大型語言模型LLM（Large Language Model）具有很強(qiáng)的通用知識理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口并且不會透露任何模型上技術(shù)細(xì)節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究價值的。

2023-05-11 17:09:16

648

如何利用LLM做一些多模態(tài)任務(wù)

本文整理了近兩年來基于LLM做vision-lanuage任務(wù)的一些工作，并將其劃分為4個類別：

2023-05-17 15:02:35

575

邱錫鵬團(tuán)隊提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

LLM 與通用人工智能（AGI）之間仍存在顯著差距。首先，大多數(shù)當(dāng)前 LLM 只能感知和理解多模態(tài)內(nèi)容，而不能自然而然地生成多模態(tài)內(nèi)容。其次，像圖像和語音這樣的連續(xù)信號不能直接適應(yīng)接收離散 token 的 LLM。

2023-05-22 14:38:06

417

LLM性能的主要因素

現(xiàn)在是2023年5月，截止目前，網(wǎng)絡(luò)上已經(jīng)開源了眾多的LLM，如何用較低的成本，判斷LLM的基礎(chǔ)性能，選到適合自己任務(wù)的LLM，成為一個關(guān)鍵。本文會涉及以下幾個問題：影響LLM性能的主要因素

2023-05-22 15:26:20

1148

如何利用LLM做多模態(tài)任務(wù)？

大型語言模型LLM（Large Language Model）具有很強(qiáng)的通用知識理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口

2023-05-22 15:57:33

466

NVIDIA 攜手微軟，在生成式 AI 的新時代推動 Windows PC 創(chuàng)新

模型（LLM）應(yīng)用、Stable Diffusion 和 Adobe Firefly 等圖片生成器，以及 NVIDIA DLSS 3 Frame Generation （DLSS 3 幀生成技術(shù)

2023-05-25 09:15:02

509

LLM在各種情感分析任務(wù)中的表現(xiàn)如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務(wù)，特別是在zero-shot和few-shot方面表現(xiàn)出它們強(qiáng)大的性能。因此，情感分析(SA)領(lǐng)域也必然少不了LLM的影子

2023-05-29 17:24:41

1379

大型語言模型（LLM）的自定義訓(xùn)練：包含代碼示例的詳細(xì)指南

近年來，像 GPT-4 這樣的大型語言模型（LLM）因其在自然語言理解和生成方面的驚人能力而受到廣泛關(guān)注。但是，要根據(jù)特定任務(wù)或領(lǐng)域定制LLM，定制培訓(xùn)是必要的。本文提供了有關(guān)自定義訓(xùn)練 LLM 的詳細(xì)分步指南，其中包含代碼示例和示例。

2023-06-12 09:35:43

1782

虹軟圖像深度恢復(fù)技術(shù)與生成式AI的創(chuàng)新生成式AI助力

當(dāng)前，生成式人工智能（AI）技術(shù)的快速發(fā)展令人矚目。它能夠理解人類的描述，并在短時間內(nèi)生成逼真的圖像和視頻。在生成式AI的應(yīng)用中，圖像深度信息具有重要的價值，準(zhǔn)確的深度圖像深度信息可以使生成的圖像

2023-06-21 09:06:42

279

基于Transformer的大型語言模型（LLM）的內(nèi)部機(jī)制

本文旨在更好地理解基于 Transformer 的大型語言模型（LLM）的內(nèi)部機(jī)制，以提高它們的可靠性和可解釋性。隨著大型語言模型（LLM）在使用和部署方面的不斷增加，打開黑箱并了解它們的內(nèi)部

2023-06-25 15:08:49

991

基于一個完整的 LLM 訓(xùn)練流程

? ? 在這篇文章中，我們將盡可能詳細(xì)地梳理一個完整的 LLM 訓(xùn)練流程。包括模型預(yù)訓(xùn)練（Pretrain）、Tokenizer 訓(xùn)練、指令微調(diào)（Instruction Tuning）等環(huán)節(jié)。文末

2023-06-29 10:08:59

1202

最新綜述！當(dāng)大型語言模型（LLM）遇上知識圖譜：兩大技術(shù)優(yōu)勢互補(bǔ)

LLM 是黑箱模型，缺乏可解釋性，因此備受批評。LLM 通過參數(shù)隱含地表示知識。因此，我們難以解釋和驗證 LLM 獲得的知識。此外，LLM 是通過概率模型執(zhí)行推理，而這是一個非決斷性的過程。對于 LLM 用以得出預(yù)測結(jié)果和決策的具體模式和功能，人類難以直接獲得詳情和解釋。

2023-07-10 11:35:00

1354

適用于各種NLP任務(wù)的開源LLM的finetune教程~

ChatGLM2-6b是清華開源的小尺寸LLM，只需要一塊普通的顯卡(32G較穩(wěn)妥)即可推理和微調(diào)，是目前社區(qū)非?；钴S的一個開源LLM。

2023-07-24 09:04:22

1311

LLM對程序員的沖擊和影響

LLM 對軟件研發(fā)的單點(diǎn)提效，我之前錄制過一段視頻，大家可以直接觀看，里面有詳細(xì)的演示，我在這里就不再贅述了。

2023-07-24 15:39:06

766

LLM的長度外推淺談

蘇神最早提出的擴(kuò)展LLM的context方法，基于bayes啟發(fā)得到的公式

2023-07-28 17:37:43

1484

NVIDIA 與 Hugging Face 將連接數(shù)百萬開發(fā)者與生成式 AI 超級計算

年 8 月 8 日 — NVIDIA 與 Hugging Face 宣布建立合作伙伴關(guān)系，為數(shù)百萬開發(fā)者提供生成式 AI 超級計算服務(wù)，幫助他們構(gòu)建大語言模型（LLM）和其他高級 AI 應(yīng)用。 ? 此次

2023-08-09 11:41:59

100

YouTube正在測試用人工智能自動生成視頻摘要功能

根據(jù)谷歌支持頁面7月31日的信息顯示，YouTube正在測試用人工智能（AI）自動生成視頻摘要的功能，這是谷歌在探索生成型 AI 技術(shù)的最新嘗試之一。通過Android Police

2023-08-15 15:58:02

1316

Stability AI發(fā)布首個用于編程的生成式LLM AI產(chǎn)品—StableCode

Stability AI 近日宣布了他們首個用于編程的生成式 LLM AI 產(chǎn)品 ——StableCode。該產(chǎn)品旨在幫助程序員完成日常工作，并為新手開發(fā)者提供實用的學(xué)習(xí)工具。

2023-08-24 11:27:03

562

Meta發(fā)布一款可以使用文本提示生成代碼的大型語言模型Code Llama

今天，Meta發(fā)布了Code Llama，一款可以使用文本提示生成代碼的大型語言模型（LLM）。

2023-08-25 09:06:57

885

MLC-LLM的編譯部署流程

MLC-LLM部署在各種硬件平臺的需求，然后我就開始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經(jīng)支持的Raven系列模型的特殊之處。 MLC-LLM的編譯部署流程

2023-09-04 09:22:46

1569

從原理到代碼理解語言模型訓(xùn)練和推理，通俗易懂，快速修煉LLM

要理解大語言模型（LLM），首先要理解它的本質(zhì)，無論預(yù)訓(xùn)練、微調(diào)還是在推理階段，核心都是next token prediction，也就是以自回歸的方式從左到右逐步生成文本。

2023-09-19 16:25:47

519

Medusa如何加速大型語言模型（LLM）的生成？

面對推測性解碼的復(fù)雜性，研究人員推出了Medusa技術(shù)，這個框架回歸了Transformer模型的本質(zhì)，減少了復(fù)雜度，增強(qiáng)了效率，讓每個生成階段都能快速產(chǎn)出結(jié)果。當(dāng)將Medusa與基于樹的注意機(jī)制結(jié)合時，生成速度提高了2到3倍。

2023-09-20 11:23:59

409

mlc-llm對大模型推理的流程及優(yōu)化方案

在 MLC-LLM 部署RWKV World系列模型實戰(zhàn)（3B模型Mac M2解碼可達(dá)26tokens/s）中提到要使用mlc-llm部署模型首先需要一個編譯過程，將原始的基于Realx搭建的模型

2023-09-26 12:25:55

383

NeurIPS 2023 | 如何從理論上研究生成式數(shù)據(jù)增強(qiáng)的效果？

擴(kuò)增通過條件生成模型生成新樣本來擴(kuò)展數(shù)據(jù)集，從而提高各種學(xué)習(xí)任務(wù)的分類性能。然而，很少有人從理論上研究生成數(shù)據(jù)增強(qiáng)的效果。為了填補(bǔ)這一空白，我們在這種非獨(dú)立同分布環(huán)境下構(gòu)建了基于穩(wěn)定性的通用泛化誤差

2023-11-05 20:15:02

358

淺析tensorrt-llm搭建運(yùn)行環(huán)境以及庫

之前玩內(nèi)測版的時候就需要cuda-12.x，正式出來仍是需要cuda-12.x，主要是因為tensorr-llm中依賴的CUBIN（二進(jìn)制代碼）是基于cuda12.x編譯生成的，想要跑只能更新驅(qū)動。

2023-11-13 14:42:41

1746

LLM的幻覺問題最新綜述

幻覺被描述為無意義或不忠實于所提供源內(nèi)容的生成內(nèi)容。根據(jù)與源內(nèi)容的矛盾，這些幻覺又進(jìn)一步分為內(nèi)在幻覺和外在幻覺。在LLMs中，幻覺的范圍包含了一個更廣泛、更全面的概念，主要集中在事實錯誤上。本文重新定義了幻覺的分類，為LLM應(yīng)用程序提供了一個更定制的框架。

2023-11-22 17:40:41

467

從HumanEval到CoderEval: 你的代碼生成模型真的work嗎？

項目中的選取了代碼生成任務(wù)來構(gòu)建CoderEval，并根據(jù)對外部依賴的程度為標(biāo)準(zhǔn)將這些任務(wù)分為6個等級、根據(jù)生成的目標(biāo)分為3類生成任務(wù)，以更多維地評估不同大模型在不同上下文場景中的生成效果。實驗結(jié)果表明，這三個模型在生成自包含函數(shù)方面的效果明顯優(yōu)于其他任務(wù)，但實際

2023-11-25 15:55:01

586

專欄發(fā)布 | LLM圈走馬換將？微軟廣告“黑五”來襲！

望創(chuàng)達(dá)2218億美元。年度機(jī)遇近在眼前，跨境出海企業(yè)如何抓住機(jī)遇、突破銷售記錄？對此，LLM或許能夠給出答案。微軟首席執(zhí)行官薩提亞·納德拉在剛剛結(jié)束的全球Ignite技術(shù)大會上曾表示，“生成式AI模型的參數(shù)范圍很廣，從需要 Azure 中最強(qiáng)大 GPU 的數(shù)萬億參數(shù)的 LLM，到數(shù)十億參

2023-11-27 08:15:02

215

全面解析大語言模型（LLM）

internal feedback：使用LLM去預(yù)測生成的plan取得成功的概率、Tree of Thought去對比不同的plan（有點(diǎn)類似AlphaGo的蒙特卡諾搜索的意思）、對中間結(jié)果進(jìn)行評估并作為長期記憶存儲

2023-12-05 14:49:47

857

一文詳解LLM模型基本架構(gòu)

LLM 中非常重要的一個概念是 Token，我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語言的基本單位，中文一般是詞或字（其實字也是詞）。比如：”我們喜歡 Rust

2023-12-25 10:38:38

657

安霸發(fā)布N1系列生成式AI芯片支持前端設(shè)備運(yùn)行本地LLM應(yīng)用

單顆 SoC 支持 1 至 340 億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，實現(xiàn)前端低功耗生成式 AI。

2024-01-09 15:19:33

597

安霸發(fā)布全新N1系列生成式AI芯片

安霸在CES 2024上發(fā)布了全新的N1系列生成式AI芯片，這是一款專門為前端設(shè)備設(shè)計的芯片，支持本地運(yùn)行大型語言模型（LLM）應(yīng)用。其單顆SoC能夠支持1至340億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，從而實現(xiàn)低功耗的生成式AI功能。

2024-01-09 15:32:54

602

2023年LLM大模型研究進(jìn)展

作為做LLM應(yīng)用的副產(chǎn)品，我們提出了RLCD[11]，通過同時使用正例和負(fù)例prompt，自動生成帶標(biāo)簽的生成樣本不需人工標(biāo)注，然后可以接大模型微調(diào)，或者用于訓(xùn)練reward models

2024-01-19 13:55:33

178

LLM推理加速新范式！推測解碼（Speculative Decoding）最新綜述

這個問題隨著LLM規(guī)模的增大愈發(fā)嚴(yán)重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個解碼步只能生成一個token。這導(dǎo)致GPU計算資源利用率

2024-01-29 15:54:24

261

100%在樹莓派上執(zhí)行的LLM項目

ChatGPT的人性口語化回復(fù)相信許多人已體驗過，也因此掀起一波大型語言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運(yùn)作技術(shù)，但LLM運(yùn)作需要龐大運(yùn)算力，因此目前多是在云端（Cloud）上執(zhí)行。

2024-02-29 16:29:59

476

已全部加載完成

搜索歷史

LLM在生成摘要方面效果到底如何？

評論

LLM在生成摘要方面效果到底如何？