探索LangChain：構(gòu)建專屬LLM應(yīng)用的基石

一、LangChain是什么

LangChain是一個(gè)框架，用于開(kāi)發(fā)由LLM驅(qū)動(dòng)的應(yīng)用程序?？梢院?jiǎn)單認(rèn)為是LLM領(lǐng)域的Spring，以及開(kāi)源版的ChatGPT插件系統(tǒng)。核心的2個(gè)功能為：

1）可以將 LLM 模型與外部數(shù)據(jù)源進(jìn)行連接。

2）允許與 LLM 模型與環(huán)境進(jìn)行交互，通過(guò)Agent使用工具。

二、LangChain核心組件

LangChain提供了各種不同的組件幫助使用LLM，如下圖所示，核心組件有Models、Indexes、Chains、Memory以及Agent。

??2.1 Models

LangChain本身不提供LLM，提供通用的接口訪問(wèn)LLM，可以很方便的更換底層的LLM以及自定義自己的LLM。主要有2大類的Models：

1）LLM：將文本字符串作為輸入并返回文本字符串的模型，類似OpenAI的text-davinci-003

2）Chat Models：由語(yǔ)言模型支持但將聊天消息列表作為輸入并返回聊天消息的模型。一般使用的ChatGPT以及Claude為Chat Models。

與模型交互的，基本上是通過(guò)給予Prompt的方式，LangChain通過(guò)PromptTemplate的方式方便我們構(gòu)建以及復(fù)用Prompt。

from langchain import PromptTemplate


prompt_template = '''作為一個(gè)資深編輯，請(qǐng)針對(duì) >>> 和 <<< 中間的文本寫(xiě)一段摘要。 
>>> {text} <<<
'''


prompt = PromptTemplate(template=prompt_template, input_variables=["text"])
print(prompt.format_prompt(text="我愛(ài)北京天安門(mén)"))

2.2 Indexes

索引和外部數(shù)據(jù)進(jìn)行集成，用于從外部數(shù)據(jù)獲取答案。如下圖所示，主要的步驟有

1）通過(guò)Document Loaders加載各種不同類型的數(shù)據(jù)源,

2）通過(guò)Text Splitters進(jìn)行文本語(yǔ)義分割

3）通過(guò)Vectorstore進(jìn)行非結(jié)構(gòu)化數(shù)據(jù)的向量存儲(chǔ)

4）通過(guò)Retriever進(jìn)行文檔數(shù)據(jù)檢索

2.2.1 Document Loaders

LangChain通過(guò)Loader加載外部的文檔，轉(zhuǎn)化為標(biāo)準(zhǔn)的Document類型。Document類型主要包含兩個(gè)屬性：page_content 包含該文檔的內(nèi)容。meta_data 為文檔相關(guān)的描述性數(shù)據(jù)，類似文檔所在的路徑等。

??2.2.2 Text Splitters

LLM一般都會(huì)限制上下文窗口的大小，有4k、16k、32k等。針對(duì)大文本就需要進(jìn)行文本分割，常用的文本分割器為RecursiveCharacterTextSplitter，可以通過(guò)separators指定分隔符。其先通過(guò)第一個(gè)分隔符進(jìn)行分割，不滿足大小的情況下迭代分割。

文本分割主要有2個(gè)考慮：

1）將語(yǔ)義相關(guān)的句子放在一塊形成一個(gè)chunk。一般根據(jù)不同的文檔類型定義不同的分隔符，或者可以選擇通過(guò)模型進(jìn)行分割。

2）chunk控制在一定的大小，可以通過(guò)函數(shù)去計(jì)算。默認(rèn)通過(guò)len函數(shù)計(jì)算，模型內(nèi)部一般都是使用token進(jìn)行計(jì)算。token通常指的是將文本或序列數(shù)據(jù)劃分成的小的單元或符號(hào)，便于機(jī)器理解和處理。使用OpenAI相關(guān)的大模型，可以通過(guò)tiktoken包去計(jì)算其token大小。

from langchain.text_splitter import RecursiveCharacterTextSplitter


text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turb
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=7000,
    chunk_overlap=0
)
docs = text_splitter.create_documents(["文本在這里"])
print(docs)

2.2.3 Vectorstore

通過(guò)Text Embedding models，將文本轉(zhuǎn)為向量，可以進(jìn)行語(yǔ)義搜索，在向量空間中找到最相似的文本片段。目前支持常用的向量存儲(chǔ)有Faiss、Chroma等。

Embedding模型支持OpenAIEmbeddings、HuggingFaceEmbeddings等。通過(guò)HuggingFaceEmbeddings加載本地模型可以節(jié)省embedding的調(diào)用費(fèi)用。

#通過(guò)cache_folder加載本地模型
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="本地模型地址")


embeddings = embeddings_model.embed_documents(
    [
        "我愛(ài)北京天安門(mén)!",
        "Hello world!"
    ]
)

2.2.4 Retriever

Retriever接口用于根據(jù)非結(jié)構(gòu)化的查詢獲取文檔，一般情況下是文檔存儲(chǔ)在向量數(shù)據(jù)庫(kù)中?？梢哉{(diào)用 get_relevant_documents 方法來(lái)檢索與查詢相關(guān)的文檔。

from langchain import FAISS
from langchain.document_loaders import WebBaseLoader
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter


loader = WebBaseLoader("https://in.m.jd.com/help/app/register_info.html")
data = loader.load()
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=800,
    chunk_overlap=0
)
docs = text_splitter.split_documents(data)
#通過(guò)cache_folder設(shè)置自己的本地模型路徑
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="models")
vectorstore = FAISS.from_documents(docs, embeddings)
result = vectorstore.as_retriever().get_relevant_documents("用戶注冊(cè)資格")
print(result)
print(len(result))

2.3 Chains

Langchain通過(guò)chain將各個(gè)組件進(jìn)行鏈接，以及chain之間進(jìn)行鏈接，用于簡(jiǎn)化復(fù)雜應(yīng)用程序的實(shí)現(xiàn)。其中主要有LLMChain、Sequential Chain以及Route Chain

2.3.1 LLMChain

最基本的鏈為L(zhǎng)LMChain，由PromptTemplate、LLM和OutputParser組成。LLM的輸出一般為文本，OutputParser用于讓LLM結(jié)構(gòu)化輸出并進(jìn)行結(jié)果解析，方便后續(xù)的調(diào)用。

類似下面的示例，給評(píng)論進(jìn)行關(guān)鍵詞提前以及情緒分析，通過(guò)LLMChain組合PromptTemplate、LLM以及OutputParser，可以很簡(jiǎn)單的實(shí)現(xiàn)一個(gè)之前通過(guò)依賴小模型不斷需要調(diào)優(yōu)的事情。

from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.output_parsers import ResponseSchema, StructuredOutputParser
from azure_chat_llm import llm


#output parser
keyword_schema = ResponseSchema(name="keyword", description="評(píng)論的關(guān)鍵詞列表")
emotion_schema = ResponseSchema(name="emotion", description="評(píng)論的情緒，正向?yàn)?，中性為0，負(fù)向?yàn)?1")
response_schemas = [keyword_schema, emotion_schema]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)
format_instructions = output_parser.get_format_instructions()


#prompt template
prompt_template_txt = '''
作為資深客服，請(qǐng)針對(duì) >>> 和 <<< 中間的文本識(shí)別其中的關(guān)鍵詞，以及包含的情緒是正向、負(fù)向還是中性。
>>> {text} <<<
RESPONSE:
{format_instructions}
'''


prompt = PromptTemplate(template=prompt_template_txt, input_variables=["text"],
                        partial_variables={"format_instructions": format_instructions})


#llmchain
llm_chain = LLMChain(prompt=prompt, llm=llm)
comment = "京東物流沒(méi)的說(shuō)，速度態(tài)度都是杠杠滴！這款路由器顏值賊高，怎么說(shuō)呢，就是泰褲辣！這線條，這質(zhì)感，這速度，嘎嘎快！以后媽媽再也不用擔(dān)心家里的網(wǎng)速了！"
result = llm_chain.run(comment)
data = output_parser.parse(result)
print(f"type={type(data)}, keyword={data['keyword']}, emotion={data['emotion']}")

輸出：

2.3.2 Sequential Chain

SequentialChains是按預(yù)定義順序執(zhí)行的鏈。SimpleSequentialChain為順序鏈的最簡(jiǎn)單形式，其中每個(gè)步驟都有一個(gè)單一的輸入/輸出，一個(gè)步驟的輸出是下一個(gè)步驟的輸入。SequentialChain 為順序鏈更通用的形式，允許多個(gè)輸入/輸出。

from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.chains import SimpleSequentialChain


first_prompt = PromptTemplate.from_template(
    "翻譯下面的內(nèi)容到中文:"
    "

{content}"
)
# chain 1: 輸入：Review 輸出： 英文的 Review
chain_trans = LLMChain(llm=llm, prompt=first_prompt, output_key="content_zh")


second_prompt = PromptTemplate.from_template(
    "一句話總結(jié)下面的內(nèi)容:"
    "

{content_zh}"
)


chain_summary = LLMChain(llm=llm, prompt=second_prompt)
overall_simple_chain = SimpleSequentialChain(chains=[chain_trans, chain_summary],verbose=True)
content = '''In a blog post authored back in 2011, Marc Andreessen warned that, “Software is eating the world.” Over a decade later, we are witnessing the emergence of a new type of technology that’s consuming the world with even greater voracity: generative artificial intelligence (AI). This innovative AI includes a unique class of large language models (LLM), derived from a decade of groundbreaking research, that are capable of out-performing humans at certain tasks. And you don’t have to have a PhD in machine learning to build with LLMs—developers are already building software with LLMs with basic HTTP requests and natural language prompts.
In this article, we’ll tell the story of GitHub’s work with LLMs to help other developers learn how to best make use of this technology. This post consists of two main sections: the first will describe at a high level how LLMs function and how to build LLM-based applications. The second will dig into an important example of an LLM-based application: GitHub Copilot code completions.
Others have done an impressive job of cataloging our work from the outside. Now, we’re excited to share some of the thought processes that have led to the ongoing success of GitHub Copilot.
'''
result = overall_simple_chain.run(content)
print(f'result={result}')

輸出：

2.3.3 Router Chain

RouterChain是根據(jù)輸入動(dòng)態(tài)的選擇下一個(gè)鏈，每條鏈處理特定類型的輸入。

RouterChain由兩個(gè)組件組成：

1）路由器鏈本身，負(fù)責(zé)選擇要調(diào)用的下一個(gè)鏈，主要有2種RouterChain，其中LLMRouterChain通過(guò)LLM進(jìn)行路由決策，EmbeddingRouterChain 通過(guò)向量搜索的方式進(jìn)行路由決策。

2）目標(biāo)鏈列表，路由器鏈可以路由到的子鏈。

初始化RouterChain以及destination_chains完成后，通過(guò)MultiPromptChain將兩者結(jié)合起來(lái)使用。

??2.3.4 Documents Chain

下面的4種Chain主要用于Document的處理，在基于文檔生成摘要、基于文檔的問(wèn)答等場(chǎng)景中經(jīng)常會(huì)用到，在后續(xù)的落地實(shí)踐里也會(huì)有所體現(xiàn)。

2.3.4.1 Stuff

StuffDocumentsChain這種鏈最簡(jiǎn)單直接，是將所有獲取到的文檔作為context放入到Prompt中，傳遞到LLM獲取答案。

這種方式可以完整的保留上下文，調(diào)用LLM的次數(shù)也比較少，建議能使用stuff的就使用這種方式。其適合文檔拆分的比較小，一次獲取文檔比較少的場(chǎng)景，不然容易超過(guò)token的限制。

??2.3.4.2 Refine

RefineDocumentsChain是通過(guò)迭代更新的方式獲取答案。先處理第一個(gè)文檔，作為context傳遞給llm，獲取中間結(jié)果intermediate answer。然后將第一個(gè)文檔的中間結(jié)果以及第二個(gè)文檔發(fā)給llm進(jìn)行處理，后續(xù)的文檔類似處理。

Refine這種方式能部分保留上下文，以及token的使用能控制在一定范圍。

??2.3.4.3 MapReduce

MapReduceDocumentsChain先通過(guò)LLM對(duì)每個(gè)document進(jìn)行處理，然后將所有文檔的答案在通過(guò)LLM進(jìn)行合并處理，得到最終的結(jié)果。

MapReduce的方式將每個(gè)document單獨(dú)處理，可以并發(fā)進(jìn)行調(diào)用。但是每個(gè)文檔之間缺少上下文。

2.3.4.4 MapRerank

MapRerankDocumentsChain和MapReduceDocumentsChain類似，先通過(guò)LLM對(duì)每個(gè)document進(jìn)行處理，每個(gè)答案都會(huì)返回一個(gè)score，最后選擇score最高的答案。

MapRerank和MapReduce類似，會(huì)大批量地調(diào)用LLM，每個(gè)document之間是獨(dú)立處理。

??2.4 Memory

正常情況下Chain無(wú)狀態(tài)的，每次交互都是獨(dú)立的，無(wú)法知道之前歷史交互的信息。LangChain使用Memory組件保存和管理歷史消息，這樣可以跨多輪進(jìn)行對(duì)話，在當(dāng)前會(huì)話中保留歷史會(huì)話的上下文。Memory組件支持多種存儲(chǔ)介質(zhì)，可以與Monogo、Redis、SQLite等進(jìn)行集成，以及簡(jiǎn)單直接形式就是Buffer Memory。常用的Buffer Memory有

1）ConversationSummaryMemory ：以摘要的信息保存記錄

2）ConversationBufferWindowMemory：以原始形式保存最新的n條記錄

3）ConversationBufferMemory：以原始形式保存所有記錄

通過(guò)查看chain的prompt，可以發(fā)現(xiàn){history}變量傳遞了從memory獲取的會(huì)話上下文。下面的示例演示了Memory的使用方式，可以很明細(xì)看到，答案是從之前的問(wèn)題里獲取的。

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory


from azure_chat_llm import llm


memory = ConversationBufferMemory()
conversation = ConversationChain(llm=llm, memory=memory, verbose=True)
print(conversation.prompt)
print(conversation.predict(input="我的姓名是tiger"))
print(conversation.predict(input="1+1=?"))
print(conversation.predict(input="我的姓名是什么"))

輸出：

??2.5 Agent

Agent字面含義就是代理，如果說(shuō)LLM是大腦，Agent就是代理大腦使用工具Tools。目前的大模型一般都存在知識(shí)過(guò)時(shí)、邏輯計(jì)算能力低等問(wèn)題，通過(guò)Agent訪問(wèn)工具，可以去解決這些問(wèn)題。目前這個(gè)領(lǐng)域特別活躍，誕生了類似AutoGPT、BabyAGI、AgentGPT等一堆優(yōu)秀的項(xiàng)目。傳統(tǒng)使用LLM，需要給定Prompt一步一步地達(dá)成目標(biāo)，通過(guò)Agent是給定目標(biāo)，其會(huì)自動(dòng)規(guī)劃并達(dá)到目標(biāo)。

2.5.1 Agent核心組件

Agent：代理，負(fù)責(zé)調(diào)用LLM以及決定下一步的Action。其中LLM的prompt必須包含agent_scratchpad變量，記錄執(zhí)行的中間過(guò)程

Tools：工具，Agent可以調(diào)用的方法。LangChain已有很多內(nèi)置的工具，也可以自定義工具。注意Tools的description屬性，LLM會(huì)通過(guò)描述決定是否使用該工具。

ToolKits：工具集，為特定目的的工具集合。類似Office365、Gmail工具集等

Agent Executor：Agent執(zhí)行器，負(fù)責(zé)進(jìn)行實(shí)際的執(zhí)行。

2.5.2 Agent的類型

一般通過(guò)initialize_agent函數(shù)進(jìn)行Agent的初始化，除了llm、tools等參數(shù)，還需要指定AgentType。

agent = initialize_agent(agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                tools=tools,
                llm=llm,
                verbose=True)
print(agent.agent.llm_chain.prompt.template)

該Agent為一個(gè)zero-shot-react-description類型的Agent，其中zero-shot表明只考慮當(dāng)前的操作，不會(huì)記錄以及參考之前的操作。react表明通過(guò)ReAct框架進(jìn)行推理，description表明通過(guò)工具的description進(jìn)行是否使用的決策。

其他的類型還有chat-conversational-react-description、conversational-react-description、react-docstore、self-ask-with-search等，類似chat-conversational-react-description通過(guò)memory記錄之前的對(duì)話，應(yīng)答會(huì)參考之前的操作。

可以通過(guò)agent.agent.llm_chain.prompt.template方法，獲取其推理決策所使用的模板。

2.5.3 自定義Tool

有多種方式可以自定義Tool，最簡(jiǎn)單的方式是通過(guò)@tool裝飾器，將一個(gè)函數(shù)轉(zhuǎn)為T(mén)ool。注意函數(shù)必須得有docString，其為T(mén)ool的描述。

from azure_chat_llm import llm
from langchain.agents import load_tools, initialize_agent, tool
from langchain.agents.agent_types import AgentType
from datetime import date


@tool
def time(text: str) -> str:
    """
    返回今天的日期。
    """
    return str(date.today())




tools = load_tools(['llm-math'], llm=llm)
tools.append(time)
agent_math = initialize_agent(agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                                   tools=tools,
                                   llm=llm,
                                   verbose=True)
print(agent_math("計(jì)算45 * 54"))
print(agent_math("今天是哪天？"))

輸出為：

三、LangChain落地實(shí)踐

3.1 文檔生成總結(jié)

1）通過(guò)Loader加載遠(yuǎn)程文檔

2）通過(guò)Splitter基于Token進(jìn)行文檔拆分

3）加載summarize鏈，鏈類型為refine，迭代進(jìn)行總結(jié)

from langchain.prompts import PromptTemplate
from langchain.document_loaders import PlaywrightURLLoader
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from azure_chat_llm import llm


loader = PlaywrightURLLoader(urls=["https://content.jr.jd.com/article/index.html?pageId=708258989"])
data = loader.load()


text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=7000,
    chunk_overlap=0
)


prompt_template = '''
作為一個(gè)資深編輯，請(qǐng)針對(duì) >>> 和 <<< 中間的文本寫(xiě)一段摘要。 
>>> {text} <<<
'''
refine_template = '''
作為一個(gè)資深編輯，基于已有的一段摘要：{existing_answer}，針對(duì) >>> 和 <<< 中間的文本完善現(xiàn)有的摘要。 
>>> {text} <<<
'''


PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
REFINE_PROMPT = PromptTemplate(
    template=refine_template, input_variables=["existing_answer", "text"]
)


chain = load_summarize_chain(llm, chain_type="refine", question_prompt=PROMPT, refine_prompt=REFINE_PROMPT, verbose=False)


docs = text_splitter.split_documents(data)
result = chain.run(docs)
print(result)

3.2 基于外部文檔的問(wèn)答

1）通過(guò)Loader加載遠(yuǎn)程文檔

2）通過(guò)Splitter基于Token進(jìn)行文檔拆分

3）通過(guò)FAISS向量存儲(chǔ)文檔，embedding加載HuggingFace的text2vec-base-chinese模型

4）自定義QA的prompt，通過(guò)RetrievalQA回答相關(guān)的問(wèn)題

from langchain.chains import RetrievalQA
from langchain.document_loaders import WebBaseLoader
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.prompts import PromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import FAISS


from azure_chat_llm import llm


loader = WebBaseLoader("https://in.m.jd.com/help/app/register_info.html")
data = loader.load()
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=800,
    chunk_overlap=0
)
docs = text_splitter.split_documents(data)
#設(shè)置自己的模型路徑
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="model")
vectorstore = FAISS.from_documents(docs, embeddings)


template = """請(qǐng)使用下面提供的背景信息來(lái)回答最后的問(wèn)題。 如果你不知道答案，請(qǐng)直接說(shuō)不知道，不要試圖憑空編造答案。
回答時(shí)最多使用三個(gè)句子，保持回答盡可能簡(jiǎn)潔。 回答結(jié)束時(shí)，請(qǐng)一定要說(shuō)"謝謝你的提問(wèn)！"
{context}
問(wèn)題: {question}
有用的回答:"""
QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context", "question"], template=template)


qa_chain = RetrievalQA.from_chain_type(llm, retriever=vectorstore.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt": QA_CHAIN_PROMPT})


result = qa_chain({"query": "用戶注冊(cè)資格"})
print(result["result"])
print(len(result['source_documents']))

? ? 四、未來(lái)發(fā)展方向

隨著大模型的發(fā)展，LangChain應(yīng)該是目前最火的LLM開(kāi)發(fā)框架，能和外部數(shù)據(jù)源交互、能集成各種常用的組件等等，大大降低了LLM應(yīng)用開(kāi)發(fā)的門(mén)檻。其創(chuàng)始人Harrison Chase也和Andrew Ng聯(lián)合開(kāi)發(fā)了2門(mén)短課程，幫忙大家快速掌握LangChain的使用。

目前大模型的迭代升級(jí)特別快，作為一個(gè)框架，LangChain也得保持特別快的迭代速度。其開(kāi)發(fā)特別拼，每天都會(huì)提交大量的commit，基本隔幾天就會(huì)發(fā)布一個(gè)新版本，其Contributor也達(dá)到了1200多人，特別活躍。

個(gè)人認(rèn)為，除了和業(yè)務(wù)結(jié)合落地LLM應(yīng)用外，還有2個(gè)大的方向可以進(jìn)一步去探索：

1）通過(guò)低代碼的形式進(jìn)一步降低LLM應(yīng)用的開(kāi)發(fā)門(mén)檻。類似langflow這樣的可視化編排工具發(fā)展也很快

2）打造更加強(qiáng)大的Agent。Agent之于大模型，個(gè)人覺(jué)得類似SQL之于DB，能大幅度提升LLM的應(yīng)用場(chǎng)景

審核編輯：黃飛

閱讀全文

ChatGPT(3870) ChatGPT(3870)
LLM(229) LLM(229)

評(píng)論

相關(guān)推薦

【比特熊充電?！繉?shí)戰(zhàn)演練構(gòu)建LLM對(duì)話引擎

Guardrails 與 Azure OpenAI 結(jié)合使用，構(gòu)建更加安全可靠的 LLM 對(duì)話引擎？本期【比特熊充電?！?NVIDIA 企業(yè)

2023-09-19 13:40:04

717

突破邊界：高性能計(jì)算引領(lǐng)LLM駛向通用人工智能AGI的創(chuàng)新紀(jì)元

ChatGPT的成功帶動(dòng)整個(gè)AIGC產(chǎn)業(yè)的發(fā)展，尤其是LLM（大型語(yǔ)言模型，大語(yǔ)言模型）、NLP、高性能計(jì)算和深度學(xué)習(xí)等領(lǐng)域。LLM的發(fā)展將為全球和中國(guó)AI芯片、AI服務(wù)器市場(chǎng)的增長(zhǎng)提供強(qiáng)勁動(dòng)力，據(jù)估算，LLM將為全球和中國(guó)AI服務(wù)器帶來(lái)約891.2億美元和338.2億美元的市場(chǎng)空間。

2023-06-25 14:31:15

575

對(duì)比解碼在LLM上的應(yīng)用

為了改進(jìn)LLM的推理能力，University of California聯(lián)合Meta AI實(shí)驗(yàn)室提出將Contrastive Decoding應(yīng)用于多種任務(wù)的LLM方法。實(shí)驗(yàn)表明，所提方法能有效改進(jìn)LLM的推理能力。讓我們走進(jìn)論文一探究竟吧！

2023-09-21 11:37:55

327

TensorRT-LLM初探（一）運(yùn)行l(wèi)lama

TensorRT-LLM正式出來(lái)有半個(gè)月了，一直沒(méi)有時(shí)間玩，周末趁著有時(shí)間跑一下。

2023-11-16 17:39:34

772

基于ICL范式的LLM的最高置信度預(yù)測(cè)方案

本文假設(shè)不同的ICL為LLM提供了關(guān)于任務(wù)的不同知識(shí)，導(dǎo)致對(duì)相同數(shù)據(jù)的不同理解和預(yù)測(cè)。因此，一個(gè)直接的研究問(wèn)題出現(xiàn)了:llm能否用多個(gè)ICL提示輸入來(lái)增強(qiáng)，以提供最可信的預(yù)測(cè)？為解決這個(gè)問(wèn)題，本文提出上下文采樣(ICS)。ICS遵循三步流程:采樣、增強(qiáng)和驗(yàn)證，如圖1所示。

2023-11-24 11:20:46

863

低比特量化技術(shù)如何幫助LLM提升性能

針對(duì)大語(yǔ)言模型 (LLM) 在部署過(guò)程中的性能需求，低比特量化技術(shù)一直是優(yōu)化效果最佳的方案之一，本文將探討低比特量化技術(shù)如何幫助 LLM 提升性能，以及新版 OpenVINO 對(duì)于低比特量化技術(shù)的支持。

2023-12-08 15:26:45

554

基于OpenVINO和LangChain構(gòu)建RAG問(wèn)答系統(tǒng)

隨著生成式 AI 的興起，和大語(yǔ)言模型對(duì)話聊天的應(yīng)用變得非常熱門(mén)，但這類應(yīng)用往往只能簡(jiǎn)單地和你“聊聊家?！?，并不能針對(duì)某些特定的行業(yè)，給出非常專業(yè)和精準(zhǔn)的答案。這也是由于大語(yǔ)言模型（以下簡(jiǎn)稱 LLM

2023-12-25 11:10:42

505

使用基于Transformers的API在CPU上實(shí)現(xiàn)LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個(gè)創(chuàng)新工具包，可基于英特爾架構(gòu)平臺(tái)，尤其是第四代英特爾至強(qiáng) 可擴(kuò)展處理器（代號(hào) SapphireRapids，SPR）顯著加速基于Transformers的大語(yǔ)言模型( LargeLanguageModel,LLM)。

2024-01-22 11:11:06

1823

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

探索者STM32F407

探索者STM32F407 DEVB_121X160MM 6~24V

2023-03-28 13:06:24

ArkUI開(kāi)發(fā)趣味體驗(yàn)，快來(lái)抽取限量HarmonyOS專屬頭像！

本次ArkUI開(kāi)發(fā)趣味體驗(yàn)活動(dòng)，將手把手教大家如何在IDE里實(shí)操一個(gè)ArkUI程序，通過(guò)補(bǔ)充缺失代碼，成功運(yùn)行程序開(kāi)啟抽獎(jiǎng)功能，抽取個(gè)人專屬頭像，做HarmonyOS第一批數(shù)字藏品家！同時(shí)本期提供

2022-12-08 17:20:47

DIY一款自己專屬的手柄

玩游戲的小伙伴都知道，有的游戲需要使用游戲手柄體驗(yàn)才會(huì)更好，今天就我們來(lái)DIY一款自己專屬的手柄！1.設(shè)計(jì)思路電腦游戲手柄和鼠標(biāo)鍵盤(pán)一樣屬于USBHID設(shè)備，Window系統(tǒng)和Linux系統(tǒng)和各種

2021-07-21 09:32:48

HarmonyOS 探索之路——電子書(shū)上線啦！

的你還不知道如何上手嗎？快來(lái)看看這本電子書(shū)下載地址：http://t.elecfans.com/ebook/118.html目錄HarmonyOS 探索之路（1）：開(kāi)箱體驗(yàn)HarmonyOS 探索之路

2021-01-28 15:03:07

HarmonyOS初步探索系列文章匯總

文章！鴻蒙初步探索系列：HarmonyOS初步探索01：下載安裝DevEco StudioHarmonyOS初步探索02：開(kāi)發(fā)第一個(gè)HarmonyOS應(yīng)用HarmonyOS初步探索03：DevEco

2020-12-15 14:56:20

IEC61850協(xié)議通信的“基石”是什么？

這里給大家介紹一下IEC61850協(xié)議通信的“基石”— ASN.1編碼。

2021-05-14 07:15:20

OPPO在5G標(biāo)準(zhǔn)、研發(fā)和應(yīng)用探索方面有哪些布局？

11月15日，在重慶召開(kāi)的《2018第二屆國(guó)際手機(jī)產(chǎn)業(yè)領(lǐng)袖峰會(huì)——5G新世界·AI云生態(tài)》論壇上，OPPO全球副總裁劉暢表示，5G可以催生出更多前所未有的應(yīng)用場(chǎng)景，OPPO正積極構(gòu)建自身的5G技術(shù)能力，并在標(biāo)準(zhǔn)、研發(fā)和應(yīng)用探索全方面的布局。OPPO全球副總裁劉暢

2019-09-11 11:51:52

【下載】《構(gòu)建嵌入式LINUX系統(tǒng)（第二版）》

Linux內(nèi)核的*新版本做過(guò)*新，并且加入之前未介紹過(guò)的程序以便協(xié)助你： ·建立你自己的GNU development toolchain(開(kāi)發(fā)工具鏈) ·為你的目標(biāo)系統(tǒng)選用、設(shè)定、構(gòu)建以及安裝專屬的內(nèi)核

2018-04-10 18:00:43

便攜設(shè)備電源管理設(shè)計(jì)技巧與難點(diǎn)探索

和通信電源的應(yīng)用工程師于相旭，帶我們走進(jìn)電源管理技術(shù)的核心，一起探索便攜電源管理技術(shù)現(xiàn)在，未來(lái)。欲了解便攜設(shè)備電源管理技術(shù)，請(qǐng)點(diǎn)擊本期話題討論話題討論：構(gòu)建低功耗不可或缺的電源管理技術(shù)嘉賓：Intersil 工業(yè)電源和通信電源的應(yīng)用工程師于相旭{:4_99:}

2014-10-14 16:08:22

利用卷積調(diào)制構(gòu)建一種新的ConvNet架構(gòu)Conv2Former

1、利用卷積探索一種更高效的編碼空域特征的方式　　本文旨在通過(guò)充分利用卷積探索一種更高效的編碼空域特征的方式：通過(guò)組合ConvNet與ViT的設(shè)計(jì)理念，本文利用卷積調(diào)制操作對(duì)自注意力進(jìn)行了簡(jiǎn)化，進(jìn)而

2022-12-19 17:37:34

如何使用Arm Compiler 5工具鏈構(gòu)建一個(gè)簡(jiǎn)單的C程序

使用Arm編譯器構(gòu)建hello世界教程向您展示了如何使用Arm Compiler 5工具鏈構(gòu)建一個(gè)簡(jiǎn)單的C程序。本教程超越了基礎(chǔ)知識(shí)，探索Arm編譯器5工具鏈的一些更高級(jí)的功能。本教程假設(shè)您已經(jīng)

2023-08-02 06:57:53

如何量身定做自己的專屬Beacon？

2021-05-20 06:39:17

打造專屬電源方案

錯(cuò)開(kāi)の折騰經(jīng)歷：ESP8266 NodeMCU文章目錄前言一、準(zhǔn)備1.材料清單2.設(shè)計(jì)思路二、焊接三、總結(jié)前言繼續(xù)之前的項(xiàng)目，現(xiàn)在任務(wù)就是將實(shí)現(xiàn)的空調(diào)控制器集成于一塊pcb板子上，并打造專屬電源方案

2021-11-11 06:39:48

數(shù)據(jù)探索與數(shù)據(jù)預(yù)處理

目錄1數(shù)據(jù)探索與數(shù)據(jù)預(yù)處理21.1 賽題回顧21.2 數(shù)據(jù)探索性分析與異常值處理21.3 相關(guān)性分析52特征工程82.1 光伏發(fā)電領(lǐng)域特征82.2 高階環(huán)境特征112.3 特征選擇113模型構(gòu)建

2021-07-12 08:37:20

機(jī)器學(xué)習(xí)基石筆記

3）機(jī)器學(xué)習(xí)基石筆記 Lecture3：Types of Learning

2020-05-26 14:53:14

機(jī)器學(xué)習(xí)基石筆記分享

機(jī)器學(xué)習(xí)基石筆記01

2020-06-03 08:14:10

林軒田機(jī)器學(xué)習(xí)基石課程個(gè)人筆記

林軒田機(jī)器學(xué)習(xí)基石課程個(gè)人筆記-第二講

2020-05-22 07:35:12

正點(diǎn)原子STM32系列——探索者V3開(kāi)發(fā)板評(píng)測(cè)報(bào)告聚合帖

】+I2C驅(qū)動(dòng)OLED jinglixix 【正點(diǎn)原子STM32探索者V3開(kāi)發(fā)板體驗(yàn)】初識(shí)STM32F407開(kāi)發(fā)板【正點(diǎn)原子STM32探索者V3開(kāi)發(fā)板體驗(yàn)】開(kāi)發(fā)環(huán)境的構(gòu)建與GPIO口的使用【正點(diǎn)

2023-05-10 15:52:16

物聯(lián)網(wǎng)的基石-MQTT協(xié)議初識(shí)

1、物聯(lián)網(wǎng)的基石-mqtt協(xié)議初識(shí)隨著 5G 時(shí)代的來(lái)臨，萬(wàn)物互聯(lián)的偉大構(gòu)想正在成為現(xiàn)實(shí)。聯(lián)網(wǎng)的物聯(lián)網(wǎng)設(shè)備在 2018 年已經(jīng)達(dá)到了 70 億，在未來(lái)兩年，僅智能水電氣表就將超過(guò)10億。海量

2022-09-08 16:03:12

精通信號(hào)處理設(shè)計(jì)小Tips（3）：必須掌握的三大基石

，以及對(duì)應(yīng)的硬件設(shè)計(jì)實(shí)現(xiàn)能力；具備通信物理層開(kāi)發(fā)設(shè)計(jì)各個(gè)方面的實(shí)戰(zhàn)經(jīng) 驗(yàn)...　　精通信號(hào)處理設(shè)計(jì)小Tips（3）：必須掌握的三大基石　　信號(hào)與信息處理涵蓋的內(nèi)容相當(dāng)廣泛，并和自動(dòng)控制，計(jì)算機(jī)等其他

2013-12-09 22:25:24

選擇藍(lán)牙開(kāi)發(fā)板啟動(dòng)你的專屬Beacon！

2021-05-21 06:45:22

彩虹AA電池賓得彩色單反專屬

彩虹AA電池賓得彩色單反專屬 2009年11月16日17:59:24

2009-11-16 17:59:34

762

專屬iPhone的兩款時(shí)尚充電器

著名的蘋(píng)果配件生產(chǎn)商Bracketron公布了最新專屬iPhone 4和IPhone 4S打造的MetalDock充電設(shè)備。

2012-05-09 09:05:36

405

e絡(luò)盟推出專屬網(wǎng)站平臺(tái)，幫助用戶構(gòu)建并推廣面向TI MCU LaunchPad的全新BoosterPack擴(kuò)展板

2013年10月21日，e絡(luò)盟日前宣布推出全新專屬網(wǎng)站平臺(tái)‘構(gòu)建你的BoosterPack’，為設(shè)計(jì)師創(chuàng)造自己獨(dú)有的BoosterPack提供資源支持。BoosterPack是一款針對(duì)TI微控制器

2013-10-22 12:00:58

869

這么萌還不買？紅米Note4X初音專屬配色圖賞

紅米Note 4X 多彩金屬，超長(zhǎng)續(xù)航，這是我們對(duì)國(guó)民手機(jī)的全新定義。這一次也特地邀請(qǐng)到初音未來(lái)，帶來(lái)她的專屬配色款。極具特色的初音未來(lái)專屬配色，不僅使手機(jī)有了一個(gè)獨(dú)特的外觀，還代表著對(duì)未來(lái)的無(wú)限期待。

2017-03-28 14:34:20

2997

構(gòu)建專屬于你的CAN-bus應(yīng)用層協(xié)議

隨著CAN-bus相關(guān)芯片價(jià)格的下降，內(nèi)置CAN控制器MCU的增多，CAN-bus當(dāng)前已經(jīng)進(jìn)入了眾多早期由于成本問(wèn)題無(wú)法使用的領(lǐng)域，成為極具生命力的現(xiàn)場(chǎng)總線，今天我們就來(lái)探討如何構(gòu)建專屬自己的CAN-bus應(yīng)用層協(xié)議。

2017-05-02 15:31:37

如何構(gòu)建專屬自己的CAN-bus應(yīng)用層協(xié)議

2017-05-04 15:39:05

954

存儲(chǔ) IC——現(xiàn)代信息技術(shù)的基石

存儲(chǔ)器可以說(shuō)是大數(shù)據(jù)時(shí)代的基石。

2019-06-06 11:23:32

7592

5G手機(jī)需專屬應(yīng)用場(chǎng)景

本文主要講述了：若無(wú)專屬應(yīng)用場(chǎng)景，5G手機(jī)或成為無(wú)米之炊

2019-08-15 10:50:37

5639

如何定義一個(gè)Blocklet基石程序

Blocklet（基石程序）是供開(kāi)發(fā)者和社區(qū)用戶在ArcBlock平臺(tái)上創(chuàng)建事物的可重用構(gòu)建模塊。簡(jiǎn)單來(lái)說(shuō)，Blocklet 可以是任何現(xiàn)成的組件、模塊、庫(kù)、前端視圖或其他簡(jiǎn)化構(gòu)建 dApp（去中心化應(yīng)用）過(guò)程的工具。

2019-09-30 10:26:43

273

特斯拉Roadster車主的專屬服務(wù)

日前據(jù)外媒報(bào)道，特斯拉向Roadster車主發(fā)送了郵件，聲稱將為車主提供包括專屬的服務(wù)顧問(wèn)在內(nèi)的“專屬渠道”，以改善多年來(lái)特斯拉對(duì)Roadster車主的服務(wù)。并邀請(qǐng)Roadster車主用他們的舊車抵價(jià)購(gòu)買新款特斯拉電動(dòng)汽車，或者用于購(gòu)買最新的Roadster跑車。

2019-12-05 16:35:51

2249

屬于使用Keil朋友的專屬文章

一篇屬于使用Keil朋友的專屬文章

2020-03-14 14:38:55

1326

英特爾構(gòu)建智慧云基石，推動(dòng)企業(yè)在數(shù)字經(jīng)濟(jì)時(shí)代前進(jìn)

“后新冠時(shí)代”，在線（云）上，人與人的交流變得更加容易。4月底，“英特爾構(gòu)建智慧云基石”線上沙龍如約舉行，英特爾及合作伙伴的專家們，圍繞著“快捷上云、高效用云、輕松管云”三個(gè)核心點(diǎn)，又延展

2020-05-09 14:46:16

3205

高通安蒙：構(gòu)建無(wú)線技術(shù)的未來(lái)，探索5G未來(lái)之路

“What’s Next in 5G”系列視頻迎來(lái)了最后一集，將由高通公司總裁兼候任CEO安蒙為大家解析高通將如何構(gòu)建無(wú)線技術(shù)的未來(lái)，探索5G未來(lái)之路。以下為安蒙演講全文： 5G未來(lái)

2021-03-02 11:29:57

1512

浪潮存儲(chǔ)助力九寨溝構(gòu)建智慧產(chǎn)業(yè)升級(jí)的數(shù)據(jù)基石

為游客營(yíng)造信息對(duì)稱、安全、舒適、有序、交通順暢的旅游環(huán)境，九寨溝借助數(shù)字科技技術(shù)構(gòu)建了智慧旅游大數(shù)據(jù)綜合管理平臺(tái)，在堅(jiān)持以景區(qū)生態(tài)環(huán)境承載量為第一前提的“保護(hù)型發(fā)展”原則，打造兼顧人與自然

2021-12-30 11:31:22

999

汽車網(wǎng)絡(luò)安全左移實(shí)踐——基于信任構(gòu)建汽車安全的探索

汽車網(wǎng)絡(luò)安全左移實(shí)踐——基于信任構(gòu)建汽車安全的探索

2023-02-06 15:06:56

611

LangChain：為你定制一個(gè)專屬的GPT

LangChain 可以輕松管理與語(yǔ)言模型的交互，將多個(gè)組件鏈接在一起，并集成額外的資源，例如 API 和數(shù)據(jù)庫(kù)。其組件包括了模型（各類LLM），提示模板（Prompts），索引，代理（Agent），記憶等等。

2023-04-24 11:27:23

980

如何利用LLM做多模態(tài)任務(wù)？

大型語(yǔ)言模型LLM（Large Language Model）具有很強(qiáng)的通用知識(shí)理解以及較強(qiáng)的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開(kāi)放多模態(tài)輸入接口并且不會(huì)透露任何模型上技術(shù)細(xì)節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究?jī)r(jià)值的。

2023-05-11 17:09:16

648

如何利用LLM做一些多模態(tài)任務(wù)

本文整理了近兩年來(lái)基于LLM做vision-lanuage任務(wù)的一些工作，并將其劃分為4個(gè)類別：

2023-05-17 15:02:35

575

LangChain簡(jiǎn)介

對(duì) ChatGPT 等應(yīng)用著迷？想試驗(yàn)他們背后的模型嗎？甚至開(kāi)源/免費(fèi)模型？不要再觀望……LangChain 是必經(jīng)之路……

2023-05-22 09:14:56

7793

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

大型語(yǔ)言模型（LLM）在各種自然語(yǔ)言處理任務(wù)上表現(xiàn)出驚人的能力。與此同時(shí)，多模態(tài)大型語(yǔ)言模型，如 GPT-4、PALM-E 和 LLaVA，已經(jīng)探索了 LLM 理解多模態(tài)信息的能力。然而，當(dāng)前

2023-05-22 14:38:06

417

LLM性能的主要因素

現(xiàn)在是2023年5月，截止目前，網(wǎng)絡(luò)上已經(jīng)開(kāi)源了眾多的LLM，如何用較低的成本，判斷LLM的基礎(chǔ)性能，選到適合自己任務(wù)的LLM，成為一個(gè)關(guān)鍵。本文會(huì)涉及以下幾個(gè)問(wèn)題：影響LLM性能的主要因素

2023-05-22 15:26:20

1148

如何利用LLM做多模態(tài)任務(wù)？

2023-05-22 15:57:33

466

如何最好地使用所有可用的 LLM 工具

鑒于價(jià)格和質(zhì)量的廣泛差異，從業(yè)者可能很難決定如何最好地使用所有可用的 LLM 工具。此外，如果服務(wù)中斷，則依賴單個(gè) API 提供者是不可靠的，這可能發(fā)生在意外高需求的情況下。

2023-05-23 17:22:30

525

LLM在各種情感分析任務(wù)中的表現(xiàn)如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務(wù)，特別是在zero-shot和few-shot方面表現(xiàn)出它們強(qiáng)大的性能。因此，情感分析(SA)領(lǐng)域也必然少不了LLM的影子

2023-05-29 17:24:41

1379

微軟將向美國(guó)政府客戶提供OpenAI的GPT模型

微軟增加了對(duì)大型語(yǔ)言模型（llm）的支持。openai推出chatgpt后，llm的使用大幅增加，微軟持有openai的股份，許多類型的公司爭(zhēng)相在llm上構(gòu)建功能。

2023-06-08 10:35:43

759

大型語(yǔ)言模型（LLM）的自定義訓(xùn)練：包含代碼示例的詳細(xì)指南

近年來(lái)，像 GPT-4 這樣的大型語(yǔ)言模型（LLM）因其在自然語(yǔ)言理解和生成方面的驚人能力而受到廣泛關(guān)注。但是，要根據(jù)特定任務(wù)或領(lǐng)域定制LLM，定制培訓(xùn)是必要的。本文提供了有關(guān)自定義訓(xùn)練 LLM 的詳細(xì)分步指南，其中包含代碼示例和示例。

2023-06-12 09:35:43

1783

Macaw-LLM：具有圖像、音頻、視頻和文本集成的多模態(tài)語(yǔ)言建模

盡管指令調(diào)整的大型語(yǔ)言模型 (LLM) 在各種 NLP 任務(wù)中表現(xiàn)出卓越的能力，但它們?cè)谖谋疽酝獾钠渌麛?shù)據(jù)模式上的有效性尚未得到充分研究。在這項(xiàng)工作中，我們提出了 Macaw-LLM，一種新穎的多模式 LLM，它無(wú)縫集成了視覺(jué)、音頻和文本信息。

2023-06-19 10:35:33

876

基于Transformer的大型語(yǔ)言模型（LLM）的內(nèi)部機(jī)制

本文旨在更好地理解基于 Transformer 的大型語(yǔ)言模型（LLM）的內(nèi)部機(jī)制，以提高它們的可靠性和可解釋性。隨著大型語(yǔ)言模型（LLM）在使用和部署方面的不斷增加，打開(kāi)黑箱并了解它們的內(nèi)部

2023-06-25 15:08:49

991

基于一個(gè)完整的 LLM 訓(xùn)練流程

? ? 在這篇文章中，我們將盡可能詳細(xì)地梳理一個(gè)完整的 LLM 訓(xùn)練流程。包括模型預(yù)訓(xùn)練（Pretrain）、Tokenizer 訓(xùn)練、指令微調(diào)（Instruction Tuning）等環(huán)節(jié)。文末

2023-06-29 10:08:59

1202

把LangChain跑起來(lái)的3個(gè)方法

使用 LangChain 開(kāi)發(fā) LLM 應(yīng)用時(shí)，需要機(jī)器進(jìn)行 GLM 部署，好多同學(xué)第一步就被勸退了，

2023-07-05 09:59:06

797

最新綜述！當(dāng)大型語(yǔ)言模型（LLM）遇上知識(shí)圖譜：兩大技術(shù)優(yōu)勢(shì)互補(bǔ)

LLM 是黑箱模型，缺乏可解釋性，因此備受批評(píng)。LLM 通過(guò)參數(shù)隱含地表示知識(shí)。因此，我們難以解釋和驗(yàn)證 LLM 獲得的知識(shí)。此外，LLM 是通過(guò)概率模型執(zhí)行推理，而這是一個(gè)非決斷性的過(guò)程。對(duì)于 LLM 用以得出預(yù)測(cè)結(jié)果和決策的具體模式和功能，人類難以直接獲得詳情和解釋。

2023-07-10 11:35:00

1354

什么是LangChain？深入地了解一下LangChain

在日常生活中，我們通常致力于構(gòu)建端到端的應(yīng)用程序。有許多自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)和持續(xù)集成/持續(xù)交付（CI/CD）流水線可用于自動(dòng)化我們的機(jī)器學(xué)習(xí)流程。我們還有像 Roboflow 和 Andrew N.G. 的 Landing AI 這樣的工具，可以自動(dòng)化或創(chuàng)建端到端的計(jì)算機(jī)視覺(jué)應(yīng)用程序。

2023-07-14 09:50:57

15274

適用于各種NLP任務(wù)的開(kāi)源LLM的finetune教程~

ChatGLM2-6b是清華開(kāi)源的小尺寸LLM，只需要一塊普通的顯卡(32G較穩(wěn)妥)即可推理和微調(diào)，是目前社區(qū)非常活躍的一個(gè)開(kāi)源LLM。

2023-07-24 09:04:22

1311

LLM對(duì)程序員的沖擊和影響

LLM 對(duì)軟件研發(fā)的單點(diǎn)提效，我之前錄制過(guò)一段視頻，大家可以直接觀看，里面有詳細(xì)的演示，我在這里就不再贅述了。

2023-07-24 15:39:06

766

LLM的長(zhǎng)度外推淺談

蘇神最早提出的擴(kuò)展LLM的context方法，基于bayes啟發(fā)得到的公式

2023-07-28 17:37:43

1484

MLC-LLM的編譯部署流程

MLC-LLM部署在各種硬件平臺(tái)的需求，然后我就開(kāi)始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經(jīng)支持的Raven系列模型的特殊之處。 MLC-LLM的編譯部署流程

2023-09-04 09:22:46

1569

檢索增強(qiáng)LLM的方案全面的介紹

分分享了 ChatGPT 這類模型是如何一步一步訓(xùn)練的，后半部分主要分享了 LLM 模型的一些應(yīng)用方向，其中就對(duì)檢索增強(qiáng) LLM 這個(gè)應(yīng)用方向做了簡(jiǎn)單介紹。

2023-09-08 16:39:55

799

mlc-llm對(duì)大模型推理的流程及優(yōu)化方案

在 MLC-LLM 部署RWKV World系列模型實(shí)戰(zhàn)（3B模型Mac M2解碼可達(dá)26tokens/s）中提到要使用mlc-llm部署模型首先需要一個(gè)編譯過(guò)程，將原始的基于Realx搭建的模型

2023-09-26 12:25:55

383

新型威脅：探索LLM攻擊對(duì)網(wǎng)絡(luò)安全的沖擊

最令人擔(dān)憂的也許是，目前尚不清楚 LLM 提供商是否能夠完全修復(fù)此類行為。在過(guò)去的 10 年里，在計(jì)算機(jī)視覺(jué)領(lǐng)域，類似的對(duì)抗性攻擊已經(jīng)被證明是一個(gè)非常棘手的問(wèn)題。有可能深度學(xué)習(xí)模型根本就無(wú)法避免這種威脅。因此，我們認(rèn)為，在增加對(duì)此類人工智能模型的使用和依賴時(shí)，應(yīng)該考慮到這些因素。

2023-10-11 16:28:37

482

Continuous Batching：解鎖LLM潛力！讓LLM推斷速度飆升23倍，降低延遲！

本文介紹一篇 LLM 推理加速技術(shù) 相關(guān)的文章，值得讀一讀。 LLMs 在現(xiàn)實(shí)應(yīng)用中的計(jì)算成本主要由服務(wù)成本所主導(dǎo)，但是傳統(tǒng)的批處理策略存在低效性。在這篇文章中，我們將告訴

2023-10-15 20:25:02

292

在線研討會(huì) | 基于 Jetson 邊緣計(jì)算平臺(tái)構(gòu)建 Azure OpenAI LLM 安全護(hù)欄

，并通過(guò)自定義方式響應(yīng)用戶特定的請(qǐng)求，按照預(yù)定義的對(duì)話路徑進(jìn)行操作，以及使用特定的語(yǔ)言風(fēng)格進(jìn)行回答等。它的核心價(jià)值在于通過(guò) Colang 語(yǔ)言來(lái)編寫(xiě)安全護(hù)欄，來(lái)指導(dǎo)、定義和控制 LLM 驅(qū)動(dòng)的對(duì)話機(jī)器人在特定主題上的行為，從而構(gòu)建可靠、安全的 LLM 對(duì)話系統(tǒng)。如何在

2023-10-21 16:35:03

215

Hugging Face LLM部署大語(yǔ)言模型到亞馬遜云科技Amazon SageMaker推理示例

?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器將開(kāi)源LLMs，比如BLOOM大型語(yǔ)言模型部署到亞馬遜云科技Amazon SageMaker進(jìn)行推理的示例。我們將部署12B

2023-11-01 17:48:42

422

LLM的Transformer是否可以直接處理視覺(jué)Token？

多種LLM Transformer都可以提升Visual Encoding。例如用LLaMA和OPT的不同Transformer層都會(huì)有提升，而且不同層之間也會(huì)體現(xiàn)不同的規(guī)律。

2023-11-03 14:10:15

181

NVIDIA AI Foundation Models：使用生產(chǎn)就緒型 LLM 構(gòu)建自定義企業(yè)聊天機(jī)器人和智能副駕

? 系列基礎(chǔ)模型是一套功能強(qiáng)大的全新工具，可用于為企業(yè)構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用，從而推動(dòng)從客服 AI 聊天機(jī)器人到尖端 AI 產(chǎn)品的各種創(chuàng)新。這些新的基礎(chǔ)模型現(xiàn)已加入? NVIDIA NeMo 。這個(gè)端到端框架用于構(gòu)建、自定義和部署專為企業(yè)定制的 LLM。企業(yè)現(xiàn)在可以使用這些工具快速

2023-11-17 21:35:01

469

LLM的幻覺(jué)問(wèn)題最新綜述

幻覺(jué)被描述為無(wú)意義或不忠實(shí)于所提供源內(nèi)容的生成內(nèi)容。根據(jù)與源內(nèi)容的矛盾，這些幻覺(jué)又進(jìn)一步分為內(nèi)在幻覺(jué)和外在幻覺(jué)。在LLMs中，幻覺(jué)的范圍包含了一個(gè)更廣泛、更全面的概念，主要集中在事實(shí)錯(cuò)誤上。本文重新定義了幻覺(jué)的分類，為LLM應(yīng)用程序提供了一個(gè)更定制的框架。

2023-11-22 17:40:41

467

基于單一LLM的情感分析方法的局限性

LLM的發(fā)展為情感分析任務(wù)帶來(lái)的新的解決方案。有研究人員使用LLM，在上下文學(xué)習(xí)(in-context learning, ICL)的范式下，僅使用少量的訓(xùn)練示例就能夠?qū)崿F(xiàn)與監(jiān)督學(xué)習(xí)策略旗鼓相當(dāng)?shù)男阅鼙憩F(xiàn)。

2023-11-23 11:14:27

322

基于Redis Enterprise，LangChain，OpenAI 構(gòu)建一個(gè)電子商務(wù)聊天機(jī)器人

鑒于最近人工智能支持的API和網(wǎng)絡(luò)開(kāi)發(fā)工具的激增，許多科技公司都在將聊天機(jī)器人集成到他們的應(yīng)用程序中。LangChain是一種備受歡迎的新框架，近期引起了廣泛關(guān)注。該框架旨在簡(jiǎn)化開(kāi)發(fā)人員與語(yǔ)言模型

2023-11-25 08:04:13

178

專欄發(fā)布 | LLM圈走馬換將？微軟廣告“黑五”來(lái)襲！

過(guò) 去一年并不平凡。從去年11月至今，LLM大型語(yǔ)言模型持續(xù)破圈、始終盤(pán)踞熱點(diǎn)話題之列。根據(jù)Adobe Analytics的最新在線購(gòu)物預(yù)測(cè)，感恩節(jié)本土市場(chǎng)假日季的在線收入，或?qū)⒂?/div>

2023-11-27 08:15:02

215

Long-Context下LLM模型架構(gòu)全面介紹

隨著ChatGPT的快速發(fā)展，基于Transformer的大型語(yǔ)言模型(LLM)為人工通用智能(AGI)鋪平了一條革命性的道路，并已應(yīng)用于知識(shí)庫(kù)、人機(jī)界面和動(dòng)態(tài)代理等不同領(lǐng)域。然而，存在一個(gè)普遍

2023-11-27 17:37:36

440

Ambarella展示了在其CV3-AD芯片上運(yùn)行LLM的能力

Ambarella前不久展示了在其CV3-AD芯片上運(yùn)行LLM的能力。這款芯片是CV3系列中最強(qiáng)大的，專為自動(dòng)駕駛設(shè)計(jì)。

2023-11-28 09:05:31

1192

怎樣使用Accelerate庫(kù)在多GPU上進(jìn)行LLM推理呢？

大型語(yǔ)言模型(llm)已經(jīng)徹底改變了自然語(yǔ)言處理領(lǐng)域。隨著這些模型在規(guī)模和復(fù)雜性上的增長(zhǎng)，推理的計(jì)算需求也顯著增加。

2023-12-01 10:24:52

396

如何利用OpenVINO加速LangChain中LLM任務(wù)

LangChain 是一個(gè)高層級(jí)的開(kāi)源的框架，從字面意義理解，LangChain 可以被用來(lái)構(gòu)建 “語(yǔ)言處理任務(wù)的鏈條”，它可以讓AI開(kāi)發(fā)人員把大型語(yǔ)言模型（LLM）的能力和外部數(shù)據(jù)結(jié)合起來(lái)，從而

2023-12-05 09:58:14

325

全面解析大語(yǔ)言模型（LLM）

internal feedback：使用LLM去預(yù)測(cè)生成的plan取得成功的概率、Tree of Thought去對(duì)比不同的plan（有點(diǎn)類似AlphaGo的蒙特卡諾搜索的意思）、對(duì)中間結(jié)果進(jìn)行評(píng)估并作為長(zhǎng)期記憶存儲(chǔ)

2023-12-05 14:49:47

857

一文詳解LLM模型基本架構(gòu)

LLM 中非常重要的一個(gè)概念是 Token，我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語(yǔ)言的基本單位，中文一般是詞或字（其實(shí)字也是詞）。比如：”我們喜歡 Rust

2023-12-25 10:38:38

657

優(yōu)于10倍參數(shù)模型！微軟發(fā)布Orca 2 LLM

微軟發(fā)布 Orca 2 LLM，這是 Llama 2 的一個(gè)調(diào)優(yōu)版本，性能與包含 10 倍參數(shù)的模型相當(dāng)，甚至更好。

2023-12-26 14:23:16

247

LangChain 0.1版本正式發(fā)布

LangChain 由 Harrison Chase 于 2022 年 10 月推出，是一個(gè)開(kāi)源編排框架，用于使用 LLM 開(kāi)發(fā)應(yīng)用程序，推出后迅速脫穎而出，截至 2023 年 6 月，它是 GitHub 上增長(zhǎng)最快的開(kāi)源項(xiàng)目。

2024-01-10 10:28:28

391

用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAIGPTs——一個(gè)構(gòu)建定制化AI代理的無(wú)代碼“應(yīng)用商店”，隨后LangChain開(kāi)發(fā)了類似的開(kāi)源工具OpenGPTs。OpenGPTs是一款低代碼的開(kāi)源框架，專用

2024-01-13 08:03:59

521

虹科分享 | 用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAI GPTs——一個(gè)構(gòu)建定制化AI代理的無(wú)代碼“應(yīng)用商店”，隨后LangChain開(kāi)發(fā)了類似的開(kāi)源工具OpenGPTs。OpenGPTs是一款低代碼的開(kāi)源框架，專用于構(gòu)建定制化的人工智能代理。

2024-01-18 10:39:08

121

2023年LLM大模型研究進(jìn)展

作為做LLM應(yīng)用的副產(chǎn)品，我們提出了RLCD[11]，通過(guò)同時(shí)使用正例和負(fù)例prompt，自動(dòng)生成帶標(biāo)簽的生成樣本不需人工標(biāo)注，然后可以接大模型微調(diào)，或者用于訓(xùn)練reward models

2024-01-19 13:55:33

178

LLM推理加速新范式！推測(cè)解碼（Speculative Decoding）最新綜述

這個(gè)問(wèn)題隨著LLM規(guī)模的增大愈發(fā)嚴(yán)重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個(gè)解碼步只能生成一個(gè)token。這導(dǎo)致GPU計(jì)算資源利用率

2024-01-29 15:54:24

261

100%在樹(shù)莓派上執(zhí)行的LLM項(xiàng)目

ChatGPT的人性口語(yǔ)化回復(fù)相信許多人已體驗(yàn)過(guò)，也因此掀起一波大型語(yǔ)言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運(yùn)作技術(shù)，但LLM運(yùn)作需要龐大運(yùn)算力，因此目前多是在云端（Cloud）上執(zhí)行。

2024-02-29 16:29:59

476

基于NVIDIA Megatron Core的MOE LLM實(shí)現(xiàn)和訓(xùn)練優(yōu)化

本文將分享阿里云人工智能平臺(tái) PAI 團(tuán)隊(duì)與 NVIDIA Megatron-Core 團(tuán)隊(duì)在 MoE (Mixture of Experts) 大語(yǔ)言模型（LLM）實(shí)現(xiàn)與訓(xùn)練優(yōu)化上的創(chuàng)新工作。

2024-03-22 09:50:37

已全部加載完成

搜索歷史

探索LangChain：構(gòu)建專屬LLM應(yīng)用的基石

評(píng)論