LLM真的能推理和規(guī)劃嗎？

【導(dǎo)讀】前段時(shí)間，LeCun轉(zhuǎn)發(fā)了2篇長(zhǎng)文，集中討論了LLM的規(guī)劃推理能力和涌現(xiàn)能力的來(lái)源。作者認(rèn)為，LLM本身不具有規(guī)劃推理能力，而涌現(xiàn)出來(lái)的能力，根源應(yīng)該都是上下文學(xué)習(xí)的結(jié)果。

大語(yǔ)言模型到底會(huì)不會(huì)推理？涌現(xiàn)出來(lái)的各種能力到底來(lái)源是什么？

前段時(shí)間，LeCun在自己推特上轉(zhuǎn)發(fā)了好幾篇文章，集中討論了這個(gè)問(wèn)題：

「自回歸LLM無(wú)法制定計(jì)劃（并且無(wú)法真正推理）」。

而LeCun轉(zhuǎn)發(fā)第二篇論文，則討論了LLM涌現(xiàn)能力。

原推表示，不管大伙相不相信LLM的涌現(xiàn)能力，這篇文章都值得一讀：

「經(jīng)過(guò)了超過(guò)1000次的系列實(shí)驗(yàn)，我們證明了大語(yǔ)言模型所謂的涌現(xiàn)能力，其實(shí)僅僅是上下文學(xué)習(xí)而已。」

LLM真的能推理和規(guī)劃嗎？

Subbarao Kambhampat的文章認(rèn)為，網(wǎng)上對(duì)于LLM能夠推理和規(guī)劃的說(shuō)法，本身不太站得住腳，但是學(xué)界對(duì)于這個(gè)問(wèn)題，也開(kāi)始進(jìn)行了很?chē)?yán)肅地研究。

至少以他之前針對(duì)GPT-3的研究看來(lái)，認(rèn)為大語(yǔ)言模型行能夠推理和規(guī)劃的說(shuō)法是有很大問(wèn)題的。

https://arxiv.org/pdf/2206.10498.pdf

我們提出了一個(gè)可擴(kuò)展的評(píng)估框架來(lái)測(cè)試LLM推理行動(dòng)和變化的能力，這是人類(lèi)智力的一個(gè)核心方面。我們提供了多個(gè)測(cè)試用例，這些測(cè)試用例比之前建立的任何基準(zhǔn)都更加復(fù)雜，并且每個(gè)測(cè)試用例都會(huì)評(píng)估有關(guān)操作和更改的推理的不同方面。GPT-3 (davinci)、Instruct-GPT-3 (text-davinci-002) 和 BLOOM (176B) 的結(jié)果顯示此類(lèi)推理任務(wù)的表現(xiàn)不佳。

針對(duì)新推出的GPT-4，教授的團(tuán)隊(duì)也將之前的研究進(jìn)行了進(jìn)一步的拓展，試圖發(fā)現(xiàn)新的最先進(jìn)的大語(yǔ)言模型是否對(duì)于推理和規(guī)劃能力有了新的進(jìn)展。

https://arxiv.org/pdf/2206.10498.pdf

我們通過(guò)在類(lèi)似于國(guó)際規(guī)劃競(jìng)賽中使用的方式，生成一組實(shí)例來(lái)進(jìn)行系統(tǒng)研究，并以兩種不同的模式評(píng)估LLM：自主模式和啟發(fā)式模式。我們的研究結(jié)果表明，法學(xué)碩士自主生成可執(zhí)行計(jì)劃的能力相當(dāng)有限，GPT-4在各個(gè)領(lǐng)域的平均成功率為～12%。

然而，啟發(fā)式模式的結(jié)果顯示出更多的希望。在啟發(fā)式模式中，我們證明了LLM生成的計(jì)劃可以改進(jìn)底層合理規(guī)劃器的搜索過(guò)程，并且還表明外部驗(yàn)證者可以幫助提供對(duì)生成的計(jì)劃的反饋，并反向提示 LLM 以更好地生成計(jì)劃。

文章用一張很有意思的圖向讀者說(shuō)明，似乎LLM表現(xiàn)出來(lái)的推理能力，主要的原因還是在于任務(wù)比較簡(jiǎn)單，提問(wèn)題的人已經(jīng)知道了問(wèn)題的答案。

而針對(duì)競(jìng)賽級(jí)別的規(guī)劃和推理任務(wù)，比如國(guó)際規(guī)劃大賽（IPC）中的積木世界（Blocks World）問(wèn)題，LLM的表現(xiàn)就不盡如人意。

初步結(jié)果表明，從GPT-3到GPT3.5再到GPT-4，生成的平面圖的精度有一定的提高，GPT-4在Blocks World中達(dá)到30%的經(jīng)驗(yàn)精度（empirical accuracy）(盡管在其他領(lǐng)域仍然較低)。

教授的研究團(tuán)隊(duì)認(rèn)為，對(duì)于很多規(guī)劃任務(wù)的表現(xiàn)，LLM的能力可能只是因?yàn)樗谔貏e大的范圍內(nèi)進(jìn)行了訓(xùn)練，從而「記住」規(guī)劃的內(nèi)容。

于是研究團(tuán)隊(duì)通過(guò)混淆規(guī)劃問(wèn)題中的動(dòng)作和對(duì)象的名稱(chēng)來(lái)降低近似檢索的有效性，阻止大語(yǔ)言模型檢索自己記住的「規(guī)劃內(nèi)容」。

在這樣的挑戰(zhàn)面前，GPT-4的經(jīng)驗(yàn)表現(xiàn)急劇下降。

對(duì)于LLM不能直接自主地進(jìn)行規(guī)劃的局限，研究團(tuán)隊(duì)通過(guò)兩種方式進(jìn)行改進(jìn)：

首先是對(duì)模型進(jìn)行微調(diào)，不過(guò)教授的團(tuán)隊(duì)在對(duì)模型進(jìn)行了微調(diào)之后，還是沒(méi)有發(fā)現(xiàn)模型的規(guī)劃能力有提升。

而且認(rèn)為，即便通過(guò)微調(diào)模型使得模型的規(guī)劃能力提高了，但是也是將規(guī)劃任務(wù)轉(zhuǎn)化為基于內(nèi)存的檢索，而不能證明大語(yǔ)言模型能夠進(jìn)行自主規(guī)劃。

第二種提高模型規(guī)劃能力的方法是不斷提示LLM，改進(jìn)它初始的計(jì)劃。

但是對(duì)于這種方法，特別是不斷讓模型自己生成改進(jìn)意見(jiàn)的提示，本質(zhì)上都是讓模型生成猜測(cè)，或者是提示的人決定哪些猜測(cè)能更好地改進(jìn)規(guī)劃，都不是模型自己提升了計(jì)劃能力。

那些頂會(huì)上聲稱(chēng)展示了LLM規(guī)劃能力的論文問(wèn)題出在哪里？

持懷疑態(tài)度的讀者現(xiàn)在可能會(huì)問(wèn)，但那些在高調(diào)的人工智能會(huì)議上聲稱(chēng)展示了LLM規(guī)劃能力的論文是怎么回事？

要分析這些說(shuō)法，首先需要明白，解決規(guī)劃任務(wù)需要：

1. 擁有必要的規(guī)劃領(lǐng)域知識(shí)

2. 能夠?qū)⑦@些計(jì)劃知識(shí)組裝成一個(gè)可執(zhí)行的計(jì)劃，該計(jì)劃負(fù)責(zé)完成子目標(biāo)，或者進(jìn)行資源交互。

第一個(gè)要素可以稱(chēng)為知識(shí)獲取，第二個(gè)要素可以稱(chēng)為推理/計(jì)劃。

許多聲稱(chēng)LLM具有規(guī)劃能力的論文，在仔細(xì)檢查后，都混淆了從LLM中提取的可執(zhí)行計(jì)劃的一般規(guī)劃知識(shí)。

如果研究人員所尋找的都是抽象的計(jì)劃，例如「婚禮計(jì)劃」，而沒(méi)有實(shí)際執(zhí)行計(jì)劃的意圖時(shí)，很容易將它們與完整的可執(zhí)行計(jì)劃混淆，從而沒(méi)法準(zhǔn)確地評(píng)估LLM的計(jì)劃能力。

教授團(tuán)隊(duì)對(duì)幾篇聲稱(chēng)LLM具有規(guī)劃能力的論文的仔細(xì)研究后發(fā)現(xiàn)，LLM要么在子目標(biāo)交互可以被安全地忽略的領(lǐng)域/任務(wù)中進(jìn)行計(jì)劃工作（規(guī)劃沒(méi)有意義的任務(wù)或者不重要的任務(wù)），要么將推理問(wèn)題委托給循環(huán)過(guò)程中的人類(lèi)來(lái)完成(通過(guò)反復(fù)提示，「糾正」計(jì)劃)。

如果沒(méi)有這些假設(shè)或者緩沖措施，從LLM中得出的計(jì)劃在外行用戶看來(lái)可能是合理的，但會(huì)導(dǎo)致執(zhí)行時(shí)出現(xiàn)各種各樣的問(wèn)題。

比如，旅行計(jì)劃書(shū)籍的大量出現(xiàn)，這些書(shū)籍內(nèi)容基本都是由LLM自動(dòng)生成出來(lái)的，而購(gòu)買(mǎi)這些書(shū)籍的讀者卻把它們誤認(rèn)為是可以執(zhí)行的計(jì)劃，最后會(huì)導(dǎo)致結(jié)果非常令讀者失望。

LLM并不存在計(jì)劃和推理能力

總而言之，教授認(rèn)為，他所讀過(guò)、驗(yàn)證過(guò)或做過(guò)的任何事情都沒(méi)有給他任何令人信服的理由，讓他相信LLM會(huì)像通常理解的那樣進(jìn)行推理/計(jì)劃。

認(rèn)為L(zhǎng)LM具有推理/規(guī)劃能力的研究所做的內(nèi)容，在大規(guī)模的訓(xùn)練下，其實(shí)都相當(dāng)于是檢索，有時(shí)會(huì)被誤認(rèn)為是推理能力。

LLM確實(shí)擅長(zhǎng)為任何任務(wù)產(chǎn)生想法，包括那些涉及推理的任務(wù)，這可以有效地用于支持推理/計(jì)劃。?換句話說(shuō)，LLM已經(jīng)擁有足夠驚人的近似檢索的能力，我們可以充分利用這種能力，不需要將虛假的推理/計(jì)劃能力歸在LLM身上。

如果對(duì)于這個(gè)問(wèn)題感興趣，還可以參考教授的一場(chǎng)演講。

而另一篇關(guān)于大語(yǔ)言模型涌現(xiàn)的能力的文章，針對(duì)的是上下文學(xué)習(xí)的能力。

涌現(xiàn)能力？不存在！

https://arxiv.org/pdf/2309.01809.pdf

簡(jiǎn)單來(lái)說(shuō)，研究人員發(fā)現(xiàn)，LLM在執(zhí)行一些沒(méi)有經(jīng)過(guò)明確訓(xùn)練的、且需要復(fù)雜推理能力的任務(wù)時(shí)，表現(xiàn)不是一般的好。

這種能力對(duì)未來(lái)NLP的研究方向產(chǎn)生了重大影響。隨著LLMs的不斷壯大，在可預(yù)見(jiàn)的未來(lái)，應(yīng)用的場(chǎng)合會(huì)越來(lái)越普遍。

但問(wèn)題在于，在研究人員評(píng)估LLMs的能力時(shí)，會(huì)被一些因素所干擾，導(dǎo)致混淆。

比方說(shuō)，有些能力可能是由prompt技術(shù)帶來(lái)的。上下文學(xué)習(xí)（in-context learning）和指令跟隨（instruction following）都是其中的例子。

這些情況也會(huì)隨著模型規(guī)模的不斷變大而增多。

因此，本文的研究團(tuán)隊(duì)全面考察了這些能力，考慮到了一些可能影響模型評(píng)估的潛在偏差因素。

研究人員對(duì)一組18個(gè)模型進(jìn)行了嚴(yán)密的測(cè)試，這些LLM的參數(shù)范圍從6000萬(wàn)到1750億不等，測(cè)試包含22項(xiàng)任務(wù)。

在經(jīng)過(guò)了1000多次實(shí)驗(yàn)后，研究人員給出了充足的證據(jù)，證明了所謂的涌現(xiàn)能力，主要就是上下文學(xué)習(xí)帶來(lái)的。

研究人員還表示，并沒(méi)有找到能證明LLM有推理能力的證據(jù)。

實(shí)驗(yàn)方法

具體來(lái)看，研究人員逐一研究了以下問(wèn)題：

·為了消除上下文學(xué)習(xí)和指令微調(diào)可能會(huì)帶來(lái)的影響，研究人員選擇了零樣本條件，并使用了非指令微調(diào)的模型。

·探究上下文學(xué)習(xí)能力和指令微調(diào)之間的相互作用，搞明白是不是該用推理能力來(lái)解釋指令微調(diào)模型的一些額外能力。為此，研究人員比較了沒(méi)有指令微調(diào)的模型和在不同程度上經(jīng)過(guò)指令微調(diào)的不同規(guī)模模型的能力。

·通過(guò)人工來(lái)檢查L(zhǎng)LM的功能性語(yǔ)言能力、形式語(yǔ)言能力，以及是否可以記住任務(wù)。

為了評(píng)估LLMs能力的真實(shí)程度，研究人員精心設(shè)計(jì)了實(shí)驗(yàn)結(jié)構(gòu)，盡可能減少誤導(dǎo)因素。

此外，該團(tuán)隊(duì)的實(shí)驗(yàn)設(shè)計(jì)特別注重不能觸發(fā)模型的上下文學(xué)習(xí)能力。比如，指令微調(diào)會(huì)將訓(xùn)練模型的指令轉(zhuǎn)化為示例（exemplar），這就可能導(dǎo)致上下文學(xué)習(xí)。

因此，實(shí)驗(yàn)團(tuán)隊(duì)使用了非指令微調(diào)的模型來(lái)避免這種可能。

下圖是研究人員所選用的模型。

研究人員對(duì)來(lái)自四個(gè)模型系列的一些不同規(guī)模的模型進(jìn)行了評(píng)估，包括GPT、T5、Falcon和LLaMA。

之所以選擇這些模型，是因?yàn)镚PT和LLaMA之前就被發(fā)現(xiàn)有涌現(xiàn)能力，而Falcon處于LLM排行榜的前列。

研究人員還選擇了T5，因?yàn)樗且粋€(gè)編碼器——解碼器模型（encoder-decoder model），其指令微調(diào)版本（Flan）是使用大量指令微調(diào)數(shù)據(jù)集訓(xùn)練出來(lái)的。

而在GPT系列中，研究人員使用了GPT-2和GPT-3的指令微調(diào)和非指令微調(diào)版本；在T5系列中，研究人員使用了T5及其指令微調(diào)的對(duì)應(yīng)版本FLAN-T5。

同樣，研究人員使用了Falcon3的指令微調(diào)版本和非指令微調(diào)版本。至于LLaMA，由于它沒(méi)有經(jīng)過(guò)指令微調(diào)，研究人員無(wú)法獲得該模型的指令微調(diào)版本。

此外，研究人員還評(píng)估了GPT-3 text-davinci-003，這是一個(gè)InstructGPT模型。InstructGPT模型最初是根據(jù)注釋者編寫(xiě)的prompt和相應(yīng)的預(yù)期行為進(jìn)行微調(diào)的，然后再使用該模型收集其它模型輸出的排序數(shù)據(jù)集，利用人類(lèi)反饋強(qiáng)化學(xué)習(xí)（RLHF）對(duì)其進(jìn)行進(jìn)一步微調(diào)。

事實(shí)證明，這種訓(xùn)練方法可以提高模型的性能。

其中，研究人員選的T5模型特意低于1B的參數(shù)量，因?yàn)樵谶@么小的模型中還沒(méi)有觀察到涌現(xiàn)能力，這在研究人員的實(shí)驗(yàn)中起到了關(guān)鍵的控制作用。

在研究人員選擇的模型中，GPT-3 davinci（非指令微調(diào)）、GPT-3 textdavinci-001（指令微調(diào)）和GPT-3 textdavinci-003（InstructGPT）都是以前觀察到過(guò)涌現(xiàn)能力的模型。這一選擇主要是出于模型可用性的考慮。

其它已證明具有涌現(xiàn)能力的模型系列包括PaLM、Chinchilla、Gopher和LaMDA，但由于沒(méi)有相應(yīng)的應(yīng)用程序接口，所以研究人員沒(méi)有對(duì)其進(jìn)行評(píng)估。

上圖為實(shí)驗(yàn)中使用的任務(wù)清單，以及這些任務(wù)在之前是否被識(shí)別為涌現(xiàn)的情況，并附有解決任務(wù)所需能力的性質(zhì)分類(lèi)。

這種分類(lèi)是通過(guò)人工檢查數(shù)據(jù)，并采用Mahowald等人提供的分類(lèi)框架確定。研究人員評(píng)估了每個(gè)任務(wù)中50個(gè)示例的記憶情況，假定任務(wù)數(shù)據(jù)沒(méi)有泄露。

上表詳細(xì)列出了整體的實(shí)驗(yàn)設(shè)置，包括測(cè)試的不同模型、實(shí)驗(yàn)中使用的不同任務(wù)以及采用的評(píng)估設(shè)置。

鑒于團(tuán)隊(duì)的目標(biāo)是評(píng)估不受其他因素影響的LLM的涌現(xiàn)能力，研究人員對(duì)從T5和GPT系列中選出的12個(gè)模型中的每個(gè)模型在所有22個(gè)選定任務(wù)上進(jìn)行了評(píng)估。

對(duì)于每種情況，研究人員都采用了相同的prompt策略：封閉式和封閉式對(duì)抗。為考慮反應(yīng)的可變性，研究人員將每個(gè)實(shí)驗(yàn)進(jìn)行三次，計(jì)算平均結(jié)果。其中運(yùn)行的所有實(shí)驗(yàn)都是在英偉達(dá)A100 GPU上進(jìn)行的，溫度為0.01，批量大小為16。

對(duì)于GPT-3 175B參數(shù)模型（davinci、text-davinci-001 和 text-davinci003），團(tuán)隊(duì)使用官方的API進(jìn)行評(píng)估，只進(jìn)行一次，溫度為0。這是因?yàn)楸疚牡难芯咳藛T也將溫度設(shè)為了0，保證了結(jié)果的可重復(fù)性，并將出現(xiàn)幻覺(jué)的可能性降至最低。

此外，他們還從LLaMA和Falcon系列中選擇了六個(gè)模型，在前面選擇的22個(gè)任務(wù)中的4個(gè)上進(jìn)行了評(píng)估。

研究人員在選擇這4個(gè)任務(wù)時(shí)，要確保其中兩個(gè)任務(wù)先前已被確定為突發(fā)任務(wù)，另外兩個(gè)任務(wù)已被確定為非突發(fā)任務(wù)。之后，團(tuán)隊(duì)再次使用封閉式和對(duì)抗式的prompt策略對(duì)它們進(jìn)行了測(cè)試，并對(duì)每個(gè)實(shí)驗(yàn)運(yùn)行三次以考慮到可能存在的差異。

鑒于某些評(píng)估任務(wù)的相關(guān)選項(xiàng)數(shù)量不固定，研究人員通過(guò)多次隨機(jī)選擇該任務(wù)中的問(wèn)題選項(xiàng)并求得平均分，來(lái)構(gòu)建每項(xiàng)任務(wù)的基線。

實(shí)驗(yàn)結(jié)果

對(duì)于第一個(gè)研究問(wèn)題：?鑒于上下文學(xué)習(xí)對(duì)LLMs中涌現(xiàn)能力存在一定的潛在影響，在沒(méi)有上下文學(xué)習(xí)（包括指令微調(diào)）的情況下，哪些能力是真正的涌現(xiàn)能力？

研究團(tuán)隊(duì)首先展示了在零樣本條件下未經(jīng)指令微調(diào)的175B參數(shù)的GPT-3模型的表現(xiàn)。

上圖是在封閉式prompt策略下，GPT系列模型在各種任務(wù)上的表現(xiàn)。

研究團(tuán)隊(duì)使用的是BERTScore精確度 (BSA) 和匹配精確度 (EMA)，在少樣本 (FS)、零樣本 (ZS) 設(shè)置下對(duì)指令調(diào)整（IT）模型和非指令調(diào)整（non-IT）模型進(jìn)行了評(píng)估。

藍(lán)色表示指令微調(diào)模型在少樣本條件下的結(jié)果，與之前文獻(xiàn)報(bào)道的結(jié)果相當(dāng)。

黃色表示在相同設(shè)置下使用BSA測(cè)得的性能，紅色表示在非指令微調(diào)模型的零樣本條件下的BSA結(jié)果，換句話說(shuō)，這種條件就代表著沒(méi)有上下文學(xué)習(xí)的影響下的結(jié)果。

上圖為Falcon（上部）和LLaMA（下部）模型在非指令調(diào)整零樣本條件下對(duì)所選任務(wù)子集的性能表現(xiàn)示意圖，表明在沒(méi)有上下文學(xué)習(xí)的情況下，模型始終缺乏所謂的涌現(xiàn)能力。

上圖為非指令微調(diào)的GPT模型在對(duì)抗環(huán)境下的表現(xiàn)，在這些任務(wù)子集上，GPT的表現(xiàn)高于隨機(jī)基線。在一些任務(wù)上的表現(xiàn)是可預(yù)測(cè)的，因此不算是涌現(xiàn)能力。

在其余任務(wù)中，與隨機(jī)基線相比，成績(jī)的提高幅度相對(duì)較小。

而針對(duì)第二個(gè)問(wèn)題：經(jīng)過(guò)指令微調(diào)的模型是否表現(xiàn)出了推理能力，還是說(shuō)指令微整更有可能使這些模型更有效、更高效地進(jìn)行上下文學(xué)習(xí)？

需要注意的是，指令微調(diào)的本質(zhì)是在指令和范例之間建立映射關(guān)系，而這正是上下文學(xué)習(xí)的特征，因此這一過(guò)程很可能確實(shí)觸發(fā)了上下文學(xué)習(xí)。

研究人員的假設(shè)意味著，指令微調(diào)為L(zhǎng)LMs提供了將指令轉(zhuǎn)化為范例的能力，而范例隨后又調(diào)動(dòng)了它們的上下文學(xué)習(xí)能力。

下圖是T5系列模型在不同環(huán)境下的性能表現(xiàn)。

審核編輯：黃飛

閱讀全文

解碼器(40056) 解碼器(40056)
編碼器(131226) 編碼器(131226)
GPT(14803) GPT(14803)
大模型(810) 大模型(810)

評(píng)論

相關(guān)推薦

對(duì)比解碼在LLM上的應(yīng)用

為了改進(jìn)LLM的推理能力，University of California聯(lián)合Meta AI實(shí)驗(yàn)室提出將Contrastive Decoding應(yīng)用于多種任務(wù)的LLM方法。實(shí)驗(yàn)表明，所提方法能有效改進(jìn)LLM的推理能力。讓我們走進(jìn)論文一探究竟吧！

2023-09-21 11:37:55

327

TensorRT-LLM初探（一）運(yùn)行l(wèi)lama

TensorRT-LLM正式出來(lái)有半個(gè)月了，一直沒(méi)有時(shí)間玩，周末趁著有時(shí)間跑一下。

2023-11-16 17:39:34

772

基于ICL范式的LLM的最高置信度預(yù)測(cè)方案

本文假設(shè)不同的ICL為LLM提供了關(guān)于任務(wù)的不同知識(shí)，導(dǎo)致對(duì)相同數(shù)據(jù)的不同理解和預(yù)測(cè)。因此，一個(gè)直接的研究問(wèn)題出現(xiàn)了:llm能否用多個(gè)ICL提示輸入來(lái)增強(qiáng)，以提供最可信的預(yù)測(cè)？為解決這個(gè)問(wèn)題，本文提出上下文采樣(ICS)。ICS遵循三步流程:采樣、增強(qiáng)和驗(yàn)證，如圖1所示。

2023-11-24 11:20:46

863

低比特量化技術(shù)如何幫助LLM提升性能

針對(duì)大語(yǔ)言模型 (LLM) 在部署過(guò)程中的性能需求，低比特量化技術(shù)一直是優(yōu)化效果最佳的方案之一，本文將探討低比特量化技術(shù)如何幫助 LLM 提升性能，以及新版 OpenVINO 對(duì)于低比特量化技術(shù)的支持。

2023-12-08 15:26:45

554

使用基于Transformers的API在CPU上實(shí)現(xiàn)LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個(gè)創(chuàng)新工具包，可基于英特爾架構(gòu)平臺(tái)，尤其是第四代英特爾至強(qiáng) 可擴(kuò)展處理器（代號(hào) SapphireRapids，SPR）顯著加速基于Transformers的大語(yǔ)言模型( LargeLanguageModel,LLM)。

2024-01-22 11:11:06

1823

LLM風(fēng)口背后，ChatGPT的成本問(wèn)題

趁著ChatGPT這一熱門(mén)話題還未消退，我們來(lái)聊一聊這類(lèi)大規(guī)模語(yǔ)言模型（LLM）或通用人工智能（AGI）背后的細(xì)節(jié)。畢竟目前相關(guān)的概念股跟風(fēng)大漲，但還是有不少人在持觀望態(tài)度。無(wú)論是國(guó)外還是國(guó)內(nèi)

2023-02-15 01:19:00

4129

用Chiplet解決ASIC在LLM上的成本問(wèn)題

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）雖說(shuō)最近靠著GPT大語(yǔ)言模型的熱度，英偉達(dá)之類(lèi)的主流GPU公司賺得盆滿缽滿，但要說(shuō)仗著GPU的高性能就能高枕無(wú)憂的話，也就未免有些癡人說(shuō)夢(mèng)了。未來(lái)隨著LLM的繼續(xù)發(fā)展

2023-07-18 00:15:00

889

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

AscendCL快速入門(mén)——模型推理篇（上）

拿到？很遺憾，用上邊這兩個(gè)接口，我們是拿不到其指針的。其實(shí)也好理解，對(duì)于很多開(kāi)發(fā)者來(lái)講，模型加載進(jìn)來(lái)之后，只要返回給開(kāi)發(fā)者一個(gè)modelId，開(kāi)發(fā)者能調(diào)用模型進(jìn)行推理就夠了，模型在內(nèi)存中存放在哪里并不

2023-08-24 11:04:14

C++演示中的推理速度比Python演示中的推理速度更快是為什么？

在同一主機(jī)機(jī)上采用相同型號(hào)的 Ran Object Detection C++ 演示和對(duì)象檢測(cè) Python 演示。 C++ 演示中的推理速度比 Python 演示中的推理速度更快。

2023-08-15 06:52:29

DSP 速度曲線規(guī)劃電機(jī)

請(qǐng)教大家，如何做DSP 電機(jī)的速度曲線規(guī)劃？ eg：做一個(gè)梯形的速度曲線規(guī)劃，有一個(gè)先加速，再勻速，再減速的過(guò)程。程序上如何實(shí)現(xiàn)呢？已經(jīng)實(shí)現(xiàn)了位置環(huán)控制。本人想在位置環(huán)內(nèi)規(guī)劃速度曲線，使得它到位能夠準(zhǔn)確。

2016-04-25 18:04:35

Dllite_micro （輕量級(jí)的 AI 推理框架）

DLLite-Micro 是一個(gè)輕量級(jí)的 AI 推理框架，可以為 OpenHarmony OS 的輕量設(shè)備和小型設(shè)備提供深度模型的推理能力DLLite-Micro 向開(kāi)發(fā)者提供清晰、易上手的北向接口

2021-08-05 11:40:11

HarmonyOS：使用MindSpore Lite引擎進(jìn)行模型推理

場(chǎng)景介紹 MindSpore Lite 是一款 AI 引擎，它提供了面向不同硬件設(shè)備 AI 模型推理的功能，目前已經(jīng)在圖像分類(lèi)、目標(biāo)識(shí)別、人臉識(shí)別、文字識(shí)別等應(yīng)用中廣泛使用。本文介紹

2023-12-14 11:41:13

YOLOv5s算法在RK3399ProD上的部署推理流程是怎樣的

YOLOv5s算法在RK3399ProD上的部署推理流程是怎樣的？基于RK33RK3399Pro怎樣使用NPU進(jìn)行加速推理呢？

2022-02-11 08:15:55

【飛凌RK3568開(kāi)發(fā)板試用體驗(yàn)】RKNN模型推理測(cè)試

研的人工智能協(xié)處理器NPU，并且提供了RKNN-Toolkit。今天就介紹一下如何使用RKNN模型進(jìn)行推理應(yīng)用程序開(kāi)發(fā)。一、推理應(yīng)用程序的基本流程RKNN 是瑞芯微（Rockchip） NPU平臺(tái)

2022-12-08 19:06:16

使用rk3588多npu推理模型，模型總推理時(shí)間還增加了，這怎么解釋

2023-11-05 18:22:42

充分利用Arm NN進(jìn)行GPU推理

Arm擁有跨所有處理器的計(jì)算IP。而且，無(wú)論您要在GPU，CPU還是NPU上進(jìn)行ML推理，都可以在一個(gè)通用框架下使用它們：Arm NN。Arm NN是適用于CPU，GPU和NPU的開(kāi)源推理引擎。它

2022-04-11 17:33:06

分享一款能連Arduino仿真的電化學(xué)軟件

分享一款能連Arduino仿真的電化學(xué)軟件，能模擬多種檢測(cè)方法，適合仿真環(huán)境文件如下：

2018-03-23 15:00:30

分享一款能連arduino仿真的電化學(xué)軟件

分享一款能連arduino仿真的電化學(xué)軟件，能模擬多種檢測(cè)方法，適合仿真環(huán)境文件如下：

2023-10-10 06:52:48

壓縮模型會(huì)加速推理嗎？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡(jiǎn)單的 CNN 導(dǎo)入到 STM32L462RCT我發(fā)現(xiàn)壓縮模型對(duì)推理時(shí)間沒(méi)有影響。aiRun 程序在 8

2023-01-29 06:24:08

圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理的簡(jiǎn)要介紹

為提升識(shí)別準(zhǔn)確率，采用改進(jìn)神經(jīng)網(wǎng)絡(luò)，通過(guò)Mnist數(shù)據(jù)集進(jìn)行訓(xùn)練。整體處理過(guò)程分為兩步：圖像預(yù)處理和改進(jìn)神經(jīng)網(wǎng)絡(luò)推理。圖像預(yù)處理主要根據(jù)圖像的特征，將數(shù)據(jù)處理成規(guī)范的格式，而改進(jìn)神經(jīng)網(wǎng)絡(luò)推理主要用于輸出結(jié)果。整個(gè)過(guò)程分為兩個(gè)步驟：圖像預(yù)處理和神經(jīng)網(wǎng)絡(luò)推理。需要提前安裝Tengine框架，

2021-12-23 08:07:33

在 ubuntu 上安裝騰訊推理框架 ncnn 的方法記錄

本教程詳細(xì)記錄了在 ubuntu 上安裝騰訊推理框架 ncnn 的方法。

2021-12-14 07:49:57

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何規(guī)劃PCB設(shè)計(jì)布線層數(shù)

　　有規(guī)劃的人生，會(huì)讓人感覺(jué)心里踏實(shí);自然，有規(guī)劃的設(shè)計(jì)，也是更讓人信服，layout工程師也可以少走彎路。　　板的層數(shù)一般不會(huì)事先確定好，會(huì)由工程師綜合板子情況給出規(guī)劃，總層數(shù)由信號(hào)層數(shù)加上電源

2018-09-20 10:56:31

如何在OpenVINO工具包中使用帶推理引擎的blob？

無(wú)法確定如何在OpenVINO?工具包中使用帶推理引擎的 blob。

2023-08-15 07:17:58

如何提高YOLOv4模型的推理性能？

使用 PyTorch 對(duì)具有非方形圖像的 YOLOv4 模型進(jìn)行了訓(xùn)練。將權(quán)重轉(zhuǎn)換為 ONNX 文件，然后轉(zhuǎn)換為中間表示（IR）。無(wú)法確定如何獲得更好的推理性能。

2023-08-15 06:58:00

工程師喊話說(shuō)：人生規(guī)劃，還不如把PCB設(shè)計(jì)布線層數(shù)規(guī)劃好！

2016年年尾敲響警鐘規(guī)劃這是一個(gè)在我們不同人生階段一直都狠刷存在感的詞匯。截止到目前為止都不能拋開(kāi)它另存獨(dú)活高中的時(shí)候父母會(huì)問(wèn)你報(bào)考什么大學(xué)大學(xué)的時(shí)候親朋好友會(huì)問(wèn)你想從事什么工作工作之后HR會(huì)問(wèn)你

2016-12-10 14:09:52

深度剖析OpenHarmony AI調(diào)度管理與推理接口

1 簡(jiǎn)介AI任務(wù)管理與統(tǒng)一的推理能力提供了接口的統(tǒng)一標(biāo)準(zhǔn)系統(tǒng)上CPU提供了AI任務(wù)調(diào)度管理的能力，對(duì)AI的能力進(jìn)行了開(kāi)放的推理和推理，同時(shí)，提供了一個(gè)不同的生命周期框架層級(jí)的應(yīng)用程序。推理接口

2022-03-25 11:15:36

用labview能實(shí)現(xiàn)挖掘機(jī)機(jī)器人的軌跡規(guī)劃嗎？

現(xiàn)在做畢業(yè)設(shè)計(jì)，是基于labview的挖掘機(jī)器人軌跡規(guī)劃與控制，就是用labview來(lái)實(shí)現(xiàn)軌跡規(guī)劃的編程，請(qǐng)教各位，這容易實(shí)現(xiàn)嗎？該從哪入手?。恐x謝了！

2013-04-01 14:32:01

請(qǐng)問(wèn)TF卡真的能影響到USB驅(qū)動(dòng)嗎？

我用金士頓的TF卡做系統(tǒng)盤(pán)就USB接口就可以用，用一個(gè)叫LD和諾的TF的時(shí)候USB口就不能用，同樣的鏡像，同樣的燒錄，同樣的板子，我想問(wèn)下TF卡真的能影響到USB驅(qū)動(dòng)嗎？

2019-09-26 23:03:19

請(qǐng)問(wèn)一下rknn多圖推理參數(shù)該怎樣去設(shè)置呢

rknn多圖推理參數(shù)設(shè)置然后進(jìn)行推理，推理的結(jié)果會(huì)把三張圖片的結(jié)果合并在一個(gè)list中，需要我們自己將其分割開(kāi)：最終其結(jié)果和單張推理的結(jié)果是相同的

2022-07-22 15:38:02

請(qǐng)問(wèn)硬件仿真的速度能達(dá)到甚至超過(guò)軟件仿真的速度嗎？

我發(fā)現(xiàn)硬件仿真的速度一般要低于軟件仿真的速度，我想主要是因?yàn)閏ache miss引起的（在使能cache的情況下），請(qǐng)問(wèn)，除了cache miss影響之外，還有哪些因素影響硬件仿真的速度，假若處理

2020-05-25 09:13:34

請(qǐng)問(wèn)硬件仿真的速度能達(dá)到甚至超過(guò)軟件仿真的速度嗎？

我發(fā)現(xiàn)硬件仿真的速度一般要低于軟件仿真的速度，我想主要是因?yàn)閏ache miss引起的（在使能cache的情況下），請(qǐng)問(wèn)，除了cache miss影響之外，還有哪些因素影響硬件仿真的速度，假若處理好的話有沒(méi)有可能硬件仿真速度大于軟件仿真速度？在硬件上需要注意哪些影響硬件仿真速度的關(guān)鍵因素？

2019-07-26 17:18:28

這個(gè)電路上芯片絲印字看不清已經(jīng)上電路圖請(qǐng)問(wèn)能推理來(lái)嗎？

這個(gè)電路上芯片絲印字看不清請(qǐng)問(wèn)能推理來(lái)嗎？整個(gè)圖

2022-05-08 23:23:59

基于事例推理的數(shù)字化城市規(guī)劃設(shè)計(jì)系統(tǒng)初探

摘要:結(jié)合數(shù)字化技術(shù)的發(fā)展，探討傳統(tǒng)城市規(guī)劃方法的數(shù)字化實(shí)現(xiàn).利用人工智能技術(shù)特別是基于事例推理(Case一Based Reasoning)技術(shù)，存貯和運(yùn)用專(zhuān)家的設(shè)計(jì)經(jīng)驗(yàn)來(lái)實(shí)現(xiàn)數(shù)字化城市規(guī)

2009-01-09 16:49:07

基于雙向混合推理機(jī)的知識(shí)庫(kù)系統(tǒng)

針對(duì)目前知識(shí)庫(kù)系統(tǒng)推理效率不高和信息可信度不強(qiáng)的特點(diǎn)，本文結(jié)合正向推理和反向推理的優(yōu)勢(shì)，取長(zhǎng)補(bǔ)短，提出了一種雙向混合推理機(jī)。本文還設(shè)計(jì)了一個(gè)原型系統(tǒng)，采用知識(shí)

2010-07-26 17:57:06

第九講機(jī)器人軌跡規(guī)劃

本內(nèi)容是有關(guān)于工業(yè)機(jī)器人的軌跡規(guī)劃與計(jì)算推理過(guò)程。

2016-04-28 10:27:15

基于案例推理的高維解空間適應(yīng)性問(wèn)題研究

利用案例推理對(duì)指揮實(shí)體任務(wù)規(guī)劃過(guò)程中決策問(wèn)題求解方法的修正過(guò)程是該方法推理過(guò)程中最困難的階段，尤其當(dāng)決策問(wèn)題解空間是多維的情況下。文章討論了指揮實(shí)體任務(wù)規(guī)劃過(guò)程中高維決策空間的修正問(wèn)題，并提出了可行

2017-12-11 11:48:35

貝葉斯IP網(wǎng)絡(luò)擁塞鏈路推理

針對(duì)CLINK算法在路由改變時(shí)擁塞鏈路推理性能下降的問(wèn)題，建立一種變結(jié)構(gòu)離散動(dòng)態(tài)貝葉斯網(wǎng)模型，通過(guò)引入馬爾可夫性及時(shí)齊性假設(shè)簡(jiǎn)化該模型，并基于簡(jiǎn)化模型提出一種IP網(wǎng)絡(luò)擁塞鏈路推理算法（VSDDB

2018-01-16 18:46:26

怎么使用蒸餾法對(duì)低精度推理出浮點(diǎn)網(wǎng)絡(luò)進(jìn)行高保真的轉(zhuǎn)換？

神經(jīng)網(wǎng)絡(luò)加速器快速、低功耗推理的一個(gè)主要挑戰(zhàn)是模型的大小。近年來(lái)，隨著模型尺寸的增加，推理時(shí)間和每次推理能耗的相應(yīng)增加，神經(jīng)網(wǎng)絡(luò)向更深的神經(jīng)網(wǎng)絡(luò)發(fā)展，激活和系數(shù)也在增加。這在資源受限的移動(dòng)和汽車(chē)

2021-06-19 14:42:16

1399

NVIDIA發(fā)布Riva語(yǔ)音AI和大型LLM軟件

　　它包括Megatron方面的進(jìn)步，這是一個(gè)由 NVIDIA 研究人員領(lǐng)導(dǎo)的開(kāi)源項(xiàng)目，旨在開(kāi)發(fā)有效培訓(xùn)法學(xué)碩士的技術(shù)。企業(yè)可以使用 NeMo Megatron 定制 LLM ，如 Megatron 530B ，并使用 NVIDIA Triton 推理服務(wù)器跨多個(gè) GPU 和節(jié)點(diǎn)進(jìn)行部署。

2022-04-01 16:27:36

10987

如何使用Triton進(jìn)行高效的推理部署

一個(gè)完整的醫(yī)療影像推理流程一般包含數(shù)據(jù)的前處理、AI 推理以及數(shù)據(jù)后處理這幾部分。

2022-04-10 15:06:09

2396

基于e-CARE的因果推理相關(guān)任務(wù)

因果推理是人類(lèi)的一項(xiàng)核心認(rèn)知能力。借助因果推理能力，人類(lèi)得以理解已觀測(cè)到的各種現(xiàn)象，并預(yù)測(cè)將來(lái)可能發(fā)生的事件。然而，盡管當(dāng)下的各類(lèi)因果推理模型已經(jīng)在現(xiàn)有的因果推理數(shù)據(jù)集上取得了令人印象深刻的性能，然而，這些模型與人類(lèi)的因果推理能力相比仍存在顯著差距。

2022-05-16 16:21:26

1081

使用多個(gè)推理芯片需要仔細(xì)規(guī)劃

過(guò)去兩年，推理芯片業(yè)務(wù)異常忙碌。有一段時(shí)間，似乎每隔一周就有另一家公司推出一種新的更好的解決方案。盡管所有這些創(chuàng)新都很棒，但問(wèn)題是大多數(shù)公司不知道如何利用各種解決方案，因?yàn)樗麄儫o(wú)法判斷哪一個(gè)比另一個(gè)

2022-07-21 10:11:59

486

如何利用LLM做多模態(tài)任務(wù)？

大型語(yǔ)言模型LLM（Large Language Model）具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開(kāi)放多模態(tài)輸入接口并且不會(huì)透露任何模型上技術(shù)細(xì)節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究?jī)r(jià)值的。

2023-05-11 17:09:16

648

如何利用LLM做一些多模態(tài)任務(wù)

本文整理了近兩年來(lái)基于LLM做vision-lanuage任務(wù)的一些工作，并將其劃分為4個(gè)類(lèi)別：

2023-05-17 15:02:35

575

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

大型語(yǔ)言模型（LLM）在各種自然語(yǔ)言處理任務(wù)上表現(xiàn)出驚人的能力。與此同時(shí)，多模態(tài)大型語(yǔ)言模型，如 GPT-4、PALM-E 和 LLaVA，已經(jīng)探索了 LLM 理解多模態(tài)信息的能力。然而，當(dāng)前

2023-05-22 14:38:06

417

LLM性能的主要因素

現(xiàn)在是2023年5月，截止目前，網(wǎng)絡(luò)上已經(jīng)開(kāi)源了眾多的LLM，如何用較低的成本，判斷LLM的基礎(chǔ)性能，選到適合自己任務(wù)的LLM，成為一個(gè)關(guān)鍵。本文會(huì)涉及以下幾個(gè)問(wèn)題：影響LLM性能的主要因素

2023-05-22 15:26:20

1148

如何利用LLM做多模態(tài)任務(wù)？

2023-05-22 15:57:33

466

如何最好地使用所有可用的 LLM 工具

鑒于價(jià)格和質(zhì)量的廣泛差異，從業(yè)者可能很難決定如何最好地使用所有可用的 LLM 工具。此外，如果服務(wù)中斷，則依賴單個(gè) API 提供者是不可靠的，這可能發(fā)生在意外高需求的情況下。

2023-05-23 17:22:30

525

中國(guó)研究人員提出StructGPT，提高LLM對(duì)結(jié)構(gòu)化數(shù)據(jù)的零樣本推理能力

盡管結(jié)構(gòu)化數(shù)據(jù)的體量往往非常巨大，但不可能容納輸入提示中的所有數(shù)據(jù)記錄（例如，ChatGPT 的最大上下文長(zhǎng)度為 4096）。將結(jié)構(gòu)化數(shù)據(jù)線性化為 LLM 可以輕松掌握的語(yǔ)句是解決此問(wèn)題的簡(jiǎn)單方法。工具操作技術(shù)激勵(lì)他們?cè)鰪?qiáng) LLM 解決上述困難的能力。

2023-05-24 16:02:16

2156

LLM在各種情感分析任務(wù)中的表現(xiàn)如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務(wù)，特別是在zero-shot和few-shot方面表現(xiàn)出它們強(qiáng)大的性能。因此，情感分析(SA)領(lǐng)域也必然少不了LLM的影子

2023-05-29 17:24:41

1379

基準(zhǔn)數(shù)據(jù)集(CORR2CAUSE)如何測(cè)試大語(yǔ)言模型(LLM)的純因果推理能力

? 因果推理是人類(lèi)智力的標(biāo)志之一。因果關(guān)系NLP領(lǐng)域近年來(lái)引起了人們的極大興趣，但其主要依賴于從常識(shí)知識(shí)中發(fā)現(xiàn)因果關(guān)系。本研究提出了一個(gè)基準(zhǔn)數(shù)據(jù)集(CORR2CAUSE)來(lái)測(cè)試大語(yǔ)言模型(LLM

2023-06-20 15:39:05

1223

基于Transformer的大型語(yǔ)言模型（LLM）的內(nèi)部機(jī)制

工作原理變得越來(lái)越重要。更好地理解這些模型是如何做出決策的，這對(duì)改進(jìn)模型和減輕其故障（如幻覺(jué)或推理錯(cuò)誤）至關(guān)重要。眾所周知，最近 LLM 成功的一個(gè)重要因素是它們能夠從上下文中學(xué)習(xí)和推理。LLM 對(duì)這些上下文的學(xué)習(xí)能力通常歸功于 Transformer 架構(gòu)，特別

2023-06-25 15:08:49

991

最新綜述！當(dāng)大型語(yǔ)言模型（LLM）遇上知識(shí)圖譜：兩大技術(shù)優(yōu)勢(shì)互補(bǔ)

LLM 是黑箱模型，缺乏可解釋性，因此備受批評(píng)。LLM 通過(guò)參數(shù)隱含地表示知識(shí)。因此，我們難以解釋和驗(yàn)證 LLM 獲得的知識(shí)。此外，LLM 是通過(guò)概率模型執(zhí)行推理，而這是一個(gè)非決斷性的過(guò)程。對(duì)于 LLM 用以得出預(yù)測(cè)結(jié)果和決策的具體模式和功能，人類(lèi)難以直接獲得詳情和解釋。

2023-07-10 11:35:00

1354

適用于各種NLP任務(wù)的開(kāi)源LLM的finetune教程~

ChatGLM2-6b是清華開(kāi)源的小尺寸LLM，只需要一塊普通的顯卡(32G較穩(wěn)妥)即可推理和微調(diào)，是目前社區(qū)非?；钴S的一個(gè)開(kāi)源LLM。

2023-07-24 09:04:22

1311

LLM對(duì)程序員的沖擊和影響

LLM 對(duì)軟件研發(fā)的單點(diǎn)提效，我之前錄制過(guò)一段視頻，大家可以直接觀看，里面有詳細(xì)的演示，我在這里就不再贅述了。

2023-07-24 15:39:06

766

LLM的長(zhǎng)度外推淺談

蘇神最早提出的擴(kuò)展LLM的context方法，基于bayes啟發(fā)得到的公式

2023-07-28 17:37:43

1484

MLC-LLM的編譯部署流程

MLC-LLM部署在各種硬件平臺(tái)的需求，然后我就開(kāi)始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經(jīng)支持的Raven系列模型的特殊之處。 MLC-LLM的編譯部署流程

2023-09-04 09:22:46

1569

檢索增強(qiáng)LLM的方案全面的介紹

分分享了 ChatGPT 這類(lèi)模型是如何一步一步訓(xùn)練的，后半部分主要分享了 LLM 模型的一些應(yīng)用方向，其中就對(duì)檢索增強(qiáng) LLM 這個(gè)應(yīng)用方向做了簡(jiǎn)單介紹。

2023-09-08 16:39:55

799

從原理到代碼理解語(yǔ)言模型訓(xùn)練和推理，通俗易懂，快速修煉LLM

要理解大語(yǔ)言模型（LLM），首先要理解它的本質(zhì)，無(wú)論預(yù)訓(xùn)練、微調(diào)還是在推理階段，核心都是next token prediction，也就是以自回歸的方式從左到右逐步生成文本。

2023-09-19 16:25:47

519

mlc-llm對(duì)大模型推理的流程及優(yōu)化方案

比如RWKV和給定的device信息一起編譯為T(mén)VM中的runtime.Module（在linux上編譯的產(chǎn)物就是.so文件）提供mlc-llm的c++推理接口調(diào)用。

2023-09-26 12:25:55

383

Continuous Batching：解鎖LLM潛力！讓LLM推斷速度飆升23倍，降低延遲！

本文介紹一篇 LLM 推理加速技術(shù) 相關(guān)的文章，值得讀一讀。 LLMs 在現(xiàn)實(shí)應(yīng)用中的計(jì)算成本主要由服務(wù)成本所主導(dǎo)，但是傳統(tǒng)的批處理策略存在低效性。在這篇文章中，我們將告訴

2023-10-15 20:25:02

292

Nvidia 通過(guò)開(kāi)源庫(kù)提升 LLM 推理性能

加利福尼亞州圣克拉拉——Nvidia通過(guò)一個(gè)名為T(mén)ensorRT LLM的新開(kāi)源軟件庫(kù)，將其H100、A100和L4 GPU的大型語(yǔ)言模型(LLM)推理性能提高了一倍。正如對(duì)相同硬件一輪又一輪改進(jìn)

2023-10-23 16:10:19

284

周四研討會(huì)預(yù)告 | 注冊(cè)報(bào)名 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)

由 CSDN 舉辦的 NVIDIA AI Inference Day - 大模型推理線上研討會(huì)，將幫助您了解 NVIDIA 開(kāi)源大型語(yǔ)言模型（LLM）推理加速庫(kù) TensorRT-LLM ?及其功能

2023-10-26 09:05:02

174

現(xiàn)已公開(kāi)發(fā)布！歡迎使用 NVIDIA TensorRT-LLM 優(yōu)化大語(yǔ)言模型推理

NVIDIA 于 2023 年 10 月 19 日公開(kāi)發(fā)布 TensorRT-LLM ，可在 NVIDIA GPU 上加速和優(yōu)化最新的大語(yǔ)言模型（Large Language Models）的推理

2023-10-27 20:05:02

478

Hugging Face LLM部署大語(yǔ)言模型到亞馬遜云科技Amazon SageMaker推理示例

?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器將開(kāi)源LLMs，比如BLOOM大型語(yǔ)言模型部署到亞馬遜云科技Amazon SageMaker進(jìn)行推理的示例。我們將部署12B

2023-11-01 17:48:42

422

點(diǎn)亮未來(lái)：TensorRT-LLM 更新加速 AI 推理性能，支持在 RTX 驅(qū)動(dòng)的 Windows PC 上運(yùn)行新模型

微軟 Ignite 2023 技術(shù)大會(huì)發(fā)布的新工具和資源包括 OpenAI?Chat?API 的 TensorRT-LLM 封裝接口、RTX 驅(qū)動(dòng)的性能改進(jìn) DirectML?for?Llama

2023-11-16 21:15:03

408

使用MLC-LLM支持RWKV-5推理的過(guò)程思考

對(duì)LLM的理解比較有限，從代碼實(shí)現(xiàn)的角度來(lái)說(shuō)，RWKV的狀態(tài)和KV Cache不同，不依賴序列長(zhǎng)度，這讓RWKV模型在各種長(zhǎng)度下運(yùn)行內(nèi)存和運(yùn)行速度都是趨于穩(wěn)定的，所以我感覺(jué)工程價(jià)值是比基于Transformer架構(gòu)比如Llama更好的，部署的性價(jià)比會(huì)天然更優(yōu)。

2023-11-19 15:58:57

502

LLM的幻覺(jué)問(wèn)題最新綜述

幻覺(jué)被描述為無(wú)意義或不忠實(shí)于所提供源內(nèi)容的生成內(nèi)容。根據(jù)與源內(nèi)容的矛盾，這些幻覺(jué)又進(jìn)一步分為內(nèi)在幻覺(jué)和外在幻覺(jué)。在LLMs中，幻覺(jué)的范圍包含了一個(gè)更廣泛、更全面的概念，主要集中在事實(shí)錯(cuò)誤上。本文重新定義了幻覺(jué)的分類(lèi)，為LLM應(yīng)用程序提供了一個(gè)更定制的框架。

2023-11-22 17:40:41

467

基于單一LLM的情感分析方法的局限性

LLM的發(fā)展為情感分析任務(wù)帶來(lái)的新的解決方案。有研究人員使用LLM，在上下文學(xué)習(xí)(in-context learning, ICL)的范式下，僅使用少量的訓(xùn)練示例就能夠?qū)崿F(xiàn)與監(jiān)督學(xué)習(xí)策略旗鼓相當(dāng)?shù)男阅鼙憩F(xiàn)。

2023-11-23 11:14:27

322

澎峰科技發(fā)布大模型推理引擎PerfXLLM

自從2020年6月OpenAI發(fā)布chatGPT之后，基于 Transformer 網(wǎng)絡(luò)結(jié)構(gòu)的語(yǔ)言大模型（LLM）引發(fā)了全世界的注意與追捧，成為了人工智能領(lǐng)域的里程碑事件。但大模型推理所需

2023-11-25 15:35:01

383

Long-Context下LLM模型架構(gòu)全面介紹

隨著ChatGPT的快速發(fā)展，基于Transformer的大型語(yǔ)言模型(LLM)為人工通用智能(AGI)鋪平了一條革命性的道路，并已應(yīng)用于知識(shí)庫(kù)、人機(jī)界面和動(dòng)態(tài)代理等不同領(lǐng)域。然而，存在一個(gè)普遍

2023-11-27 17:37:36

440

怎樣使用Accelerate庫(kù)在多GPU上進(jìn)行LLM推理呢？

大型語(yǔ)言模型(llm)已經(jīng)徹底改變了自然語(yǔ)言處理領(lǐng)域。隨著這些模型在規(guī)模和復(fù)雜性上的增長(zhǎng)，推理的計(jì)算需求也顯著增加。

2023-12-01 10:24:52

396

用上這個(gè)工具包，大模型推理性能加速達(dá)40倍

作者：英特爾公司沈海豪、羅嶼、孟恒宇、董波、林俊編者按：只需不到9行代碼，就能在CPU上實(shí)現(xiàn)出色的LLM推理性能。英特爾 ?Extension for Transformer 創(chuàng)新

2023-12-01 20:40:03

552

如何利用OpenVINO加速LangChain中LLM任務(wù)

LangChain 是一個(gè)高層級(jí)的開(kāi)源的框架，從字面意義理解，LangChain 可以被用來(lái)構(gòu)建 “語(yǔ)言處理任務(wù)的鏈條”，它可以讓AI開(kāi)發(fā)人員把大型語(yǔ)言模型（LLM）的能力和外部數(shù)據(jù)結(jié)合起來(lái)，從而

2023-12-05 09:58:14

325

全面解析大語(yǔ)言模型（LLM）

internal feedback：使用LLM去預(yù)測(cè)生成的plan取得成功的概率、Tree of Thought去對(duì)比不同的plan（有點(diǎn)類(lèi)似AlphaGo的蒙特卡諾搜索的意思）、對(duì)中間結(jié)果進(jìn)行評(píng)估并作為長(zhǎng)期記憶存儲(chǔ)

2023-12-05 14:49:47

857

一文詳解LLM模型基本架構(gòu)

LLM 中非常重要的一個(gè)概念是 Token，我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語(yǔ)言的基本單位，中文一般是詞或字（其實(shí)字也是詞）。比如：”我們喜歡 Rust

2023-12-25 10:38:38

657

優(yōu)于10倍參數(shù)模型！微軟發(fā)布Orca 2 LLM

微軟發(fā)布 Orca 2 LLM，這是 Llama 2 的一個(gè)調(diào)優(yōu)版本，性能與包含 10 倍參數(shù)的模型相當(dāng)，甚至更好。

2023-12-26 14:23:16

247

ChatGPT是一個(gè)好的因果推理器嗎？

因果推理能力對(duì)于許多自然語(yǔ)言處理（NLP）應(yīng)用至關(guān)重要。最近的因果推理系統(tǒng)主要基于經(jīng)過(guò)微調(diào)的預(yù)訓(xùn)練語(yǔ)言模型（PLMs），如BERT [1] 和RoBERTa [2]。

2024-01-03 09:55:37

420

基于LLM的表格數(shù)據(jù)的大模型推理綜述

面向表格數(shù)據(jù)的推理任務(wù)，在計(jì)算機(jī)領(lǐng)域，特別是自然語(yǔ)言處理（Natural Language Processing，NLP）領(lǐng)域的研究中扮演著重要角色[1]。該任務(wù)要求模型在給定一個(gè)或多個(gè)表格的情況下，按照任務(wù)要求，生成相應(yīng)的結(jié)果作為答案（例如：表格問(wèn)答、表格事實(shí)判斷）。

2024-01-08 09:56:14

357

安霸發(fā)布N1系列生成式AI芯片支持前端設(shè)備運(yùn)行本地LLM應(yīng)用

單顆 SoC 支持 1 至 340 億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，實(shí)現(xiàn)前端低功耗生成式 AI。

2024-01-09 15:19:33

597

LLM推理加速新范式！推測(cè)解碼（Speculative Decoding）最新綜述

這個(gè)問(wèn)題隨著LLM規(guī)模的增大愈發(fā)嚴(yán)重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個(gè)解碼步只能生成一個(gè)token。這導(dǎo)致GPU計(jì)算資源利用率

2024-01-29 15:54:24

261

100%在樹(shù)莓派上執(zhí)行的LLM項(xiàng)目

ChatGPT的人性口語(yǔ)化回復(fù)相信許多人已體驗(yàn)過(guò)，也因此掀起一波大型語(yǔ)言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運(yùn)作技術(shù)，但LLM運(yùn)作需要龐大運(yùn)算力，因此目前多是在云端（Cloud）上執(zhí)行。

2024-02-29 16:29:59

476

深度探討VLMs距離視覺(jué)演繹推理還有多遠(yuǎn)？

通用大型語(yǔ)言模型（LLM）推理基準(zhǔn)：研究者們介紹了多種基于文本的推理任務(wù)和基準(zhǔn)，用于評(píng)估LLMs在不同領(lǐng)域（如常識(shí)、數(shù)學(xué)推理、常識(shí)推理、事實(shí)推理和編程）的性能。這些研究包括BIG-bench、HELM、SuperGLUE和LAMA等。

2024-03-19 14:32:55

已全部加載完成

搜索歷史

LLM真的能推理和規(guī)劃嗎？

評(píng)論

LLM真的能推理和規(guī)劃嗎？