欧美日韩亚洲精品,视频二区国产精品职场同事

每一次技術(shù)風(fēng)口，在掀起浪潮的同時(shí)也伴生著泡沫，盡管這輪GenAI革命無疑是一次深刻改變?nèi)祟愇拿鬟M(jìn)程的革命，但過去一年，關(guān)于AI, 有太多荒謬不實(shí)、不負(fù)責(zé)任的雜音，也有太多為技術(shù)而技術(shù)的錯(cuò)誤應(yīng)用范式。

近日，昆侖巢聯(lián)合各路AI領(lǐng)域大咖和組織機(jī)構(gòu)，舉辦首期人工智能應(yīng)用實(shí)踐討論專場，打造了一場圍繞AI應(yīng)用的線上思辨對談，旨在促進(jìn)AI行業(yè)的深入思考和建設(shè)性對話。云知聲算法研發(fā)總監(jiān)王亦寧應(yīng)邀出席活動(dòng)并帶來主題為《基于山海大模型的領(lǐng)域級RAG技術(shù)探索及其實(shí)踐》的深度演講。

現(xiàn)場，王亦寧結(jié)合其在人工智能領(lǐng)域的豐富經(jīng)驗(yàn)，深入剖析了RAG技術(shù)在大模型中的關(guān)鍵作用，并基于山海大模型的構(gòu)建與實(shí)際落地探索，分享了山海大模型的企業(yè)級優(yōu)化策略，為與會(huì)者提供了實(shí)現(xiàn)技術(shù)深度融合與價(jià)值最大化的前瞻性洞見。

以下為分享精華，我們做了整理，謹(jǐn)供學(xué)習(xí)：

PART 1

RAG：山海大模型的創(chuàng)新應(yīng)用與實(shí)踐探索

當(dāng)前，大語言模型應(yīng)用主要面臨私有部署難、幻覺問題、安全合規(guī)以及知識更新局限性等問題。正是在這樣的背景下，檢索增強(qiáng)生成技術(shù)（Retrieval-Augmented Generation，RAG）應(yīng)時(shí)而生，成為大模型時(shí)代的一大趨勢。

RAG是指檢索增強(qiáng)生成（Retrieval Augmented Generation ）技術(shù)，其在大語言模型生成答案之前，先從廣泛的文檔數(shù)據(jù)庫中檢索相關(guān)信息，然后利用這些信息來引導(dǎo)生成過程，極大地提升了內(nèi)容的準(zhǔn)確性和相關(guān)性。

盡管RAG技術(shù)在提升語言模型的復(fù)雜查詢處理能力方面具有顯著優(yōu)勢，但在實(shí)際應(yīng)用中仍面臨一些關(guān)鍵挑戰(zhàn)。這些挑戰(zhàn)包括保持語義連貫性、過濾無關(guān)信息、處理口語化表達(dá)、避免生成錯(cuò)誤信息以及減少干擾等。王亦寧強(qiáng)調(diào)，解決這些問題對于提升RAG性能和應(yīng)用范圍至關(guān)重要。

會(huì)上，王亦寧向與會(huì)觀眾展示了RAG技術(shù)如何與大模型結(jié)合，以強(qiáng)化其在特定領(lǐng)域的應(yīng)用效能。具體來說，首先通過口語改寫和Query優(yōu)化，精確捕捉用戶意圖。隨后，利用向量化技術(shù)在向量數(shù)據(jù)庫中高效檢索相關(guān)信息，并通過多路召回策略全面搜集數(shù)據(jù)，過濾噪聲。在生成階段，采用關(guān)鍵信息抽取和Prompt工程技術(shù)，確?；卮鸬臏?zhǔn)確性和相關(guān)性，避免錯(cuò)誤信息的產(chǎn)生。最后，嚴(yán)格的問答校驗(yàn)流程，保證了輸出回答的高質(zhì)量，確保為用戶提供更可靠的內(nèi)容。

整體而言，RAG技術(shù)的應(yīng)用，幫助山海大模型打造了一個(gè)高效、準(zhǔn)確的問答系統(tǒng)，有效緩解了幻覺問題，提高了知識更新的速度，并增強(qiáng)了內(nèi)容生成的可追溯性，使得大語言模型在實(shí)際應(yīng)用中變得更加實(shí)用和可信。

為了具體展示RAG在山海大模型中的應(yīng)用，王亦寧以工業(yè)問答為例，向與會(huì)嘉賓生動(dòng)展示了如何利用山海模型進(jìn)行高效的Query Answer Retrieval。通過基于Copy機(jī)制的RAG、Query改寫、檢索精排、候選結(jié)果過濾、關(guān)鍵信息抽取和片段校驗(yàn)等技術(shù)，山海RAG技術(shù)方案在增強(qiáng)大模型回答質(zhì)量的同時(shí)，更確保了在不確定性情況下的可靠性，使得大模型在特定領(lǐng)域的應(yīng)用更加精準(zhǔn)、高效和可信。

PART 2

打造企業(yè)級應(yīng)用范式，山海的六大優(yōu)化實(shí)踐路徑

演講后半段，王亦寧分享了山海大模型在企業(yè)級應(yīng)用中的優(yōu)化實(shí)踐，包含預(yù)訓(xùn)練、指令微調(diào)、對齊、Agent、解碼策略、提示工程六大策略。

預(yù)訓(xùn)練：

利用行業(yè)特定的語料庫對模型進(jìn)行進(jìn)一步的預(yù)訓(xùn)練，使其能夠更好地理解和適應(yīng)特定行業(yè)的術(shù)語、概念和上下文。在醫(yī)療行業(yè)語料庫的加持下，山海大模型于2023年6月的MedQA任務(wù)中超越Med-PaLM 2，取得87.1%的優(yōu)異成績；在臨床執(zhí)業(yè)醫(yī)師資格考試中提升至523（總分600分），超過99%的考生水平。

指令微調(diào)：

在企業(yè)級應(yīng)用中，云知聲采用了一系列微調(diào)策略以提升其大模型的性能——全量SFT通過大規(guī)模標(biāo)注數(shù)據(jù)集對模型進(jìn)行全面訓(xùn)練，以確保模型在特定任務(wù)上達(dá)到最優(yōu)表現(xiàn)；LoRA和QLoRA技術(shù)通過引入低秩結(jié)構(gòu)和量化方法，高效調(diào)整模型參數(shù)，使模型能夠快速適應(yīng)新任務(wù)，同時(shí)降低資源消耗；P-Tuning策略則專注于優(yōu)化模型的特定部分，以增強(qiáng)模型對新數(shù)據(jù)的適應(yīng)性；Adaptor技術(shù)通過在模型主體之外添加小型適配器網(wǎng)絡(luò)，使模型能夠在保持原有結(jié)構(gòu)的同時(shí)，學(xué)習(xí)并適應(yīng)新任務(wù)的特征。這些策略的綜合應(yīng)用，使得山海大模型在保持預(yù)訓(xùn)練優(yōu)勢的基礎(chǔ)上，能夠精準(zhǔn)滿足企業(yè)級應(yīng)用的多樣化需求。

對齊：

為確保大模型的輸出與用戶需求和偏好保持一致，云知聲在大模型的企業(yè)級優(yōu)化過程中采用了RLHF、RLAIF、DPO三大對齊策略——RLHF通過分析用戶的直接反饋，使用強(qiáng)化學(xué)習(xí)來優(yōu)化模型行為，使其生成的答復(fù)更加精準(zhǔn)和符合期望；RLAIF進(jìn)一步通過逆向獎(jiǎng)勵(lì)機(jī)制增強(qiáng)模型的學(xué)習(xí)能力，鼓勵(lì)生成高質(zhì)量答案并避免不相關(guān)輸出；DPO則直接針對用戶偏好進(jìn)行優(yōu)化，通過比較不同輸出樣本來提升模型輸出的滿意度。這些策略的結(jié)合不僅提升了模型的響應(yīng)質(zhì)量，還增強(qiáng)了模型適應(yīng)不同用戶需求的能力，從而在企業(yè)級應(yīng)用中實(shí)現(xiàn)更加個(gè)性化和更高效的服務(wù)。

Agent：

山海大模型通過一系列Agent創(chuàng)新策略，顯著提升了企業(yè)級應(yīng)用的效能。Web搜索增強(qiáng)賦予了Agent實(shí)時(shí)訪問互聯(lián)網(wǎng)信息的能力，確保答復(fù)的時(shí)效性和準(zhǔn)確性；外部檢索增強(qiáng)則讓Agent深入挖掘企業(yè)內(nèi)部知識庫，提供專業(yè)且深入的答復(fù)；ToolLLM進(jìn)一步擴(kuò)展了Agent的功能，集成了多種輔助工具，使得語言模型能夠執(zhí)行更復(fù)雜的任務(wù)。

解碼策略：

解碼策略是優(yōu)化語言模型輸出的關(guān)鍵環(huán)節(jié)，涉及多種技術(shù)以適應(yīng)不同的應(yīng)用需求。Greedy Search以其簡潔性快速選擇最可能的詞，而Beam Search通過考慮多個(gè)最可能的序列來增加找到最優(yōu)解的幾率。Top-k采樣通過限制詞的選擇范圍來平衡結(jié)果的多樣性和準(zhǔn)確性。Copy Mechanism允許模型復(fù)制輸入中的短語，以提高回答的準(zhǔn)確性。Restricted Decoding確保輸出內(nèi)容的適當(dāng)性，而推測性解碼Speculative Decoding允許模型生成基于假設(shè)的答案，適用于需要?jiǎng)?chuàng)造性的場景。這些策略的綜合應(yīng)用，使得語言模型能夠靈活地處理各種復(fù)雜的查詢，提供高質(zhì)量、多樣化且符合用戶需求的回答。

提示工程：

提示工程提升了模型對任務(wù)的理解和生成文本的準(zhǔn)確性，是提高語言模型在各種應(yīng)用場景中表現(xiàn)的關(guān)鍵。它包括利用上下文學(xué)習(xí)（In-context Learning）為模型提供豐富的背景信息，使其能夠基于少量示例快速適應(yīng)新任務(wù)；構(gòu)建思維鏈（Chain of Thought）和思維樹（Thought Trees）以模擬逐步的邏輯推理過程，增強(qiáng)模型解決復(fù)雜問題的能力；以及確保自我一致性（Self-consistency），使模型輸出在邏輯上連貫無矛盾。

此外，云知聲UniDataOps框架通過其綜合性的數(shù)據(jù)處理能力，為大型語言模型的訓(xùn)練和微調(diào)提供了一個(gè)強(qiáng)大、可靠的數(shù)據(jù)基礎(chǔ)，從而顯著提升企業(yè)級大模型應(yīng)用的性能和效果。

演講的尾聲，王亦寧對未來人工智能技術(shù)的發(fā)展前景表達(dá)了積極樂觀的態(tài)度，他表示，云知聲期望通過深化對復(fù)雜文本數(shù)據(jù)的分析和格式處理，提升對視覺信息的解讀能力，并實(shí)現(xiàn)基于圖像的內(nèi)容問答功能，從而拓展AI在多模態(tài)交互和智能理解方面的可能性，為用戶帶來更加多樣化和個(gè)性化的應(yīng)用體驗(yàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
29383

瀏覽量
267678
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46348

瀏覽量
236517
云知聲

云知聲

+關(guān)注

關(guān)注
0

文章
156

瀏覽量
8342

原文標(biāo)題：云知聲出席昆侖巢首期人工智能應(yīng)用實(shí)踐討論專場并作主題分享

文章出處：【微信號：云知聲，微信公眾號：云知聲】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

云知聲山海大模型多項(xiàng)能力全球領(lǐng)跑

國內(nèi)人工智能權(quán)威機(jī)構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評測選取海內(nèi)外24個(gè)具有代表性的大模型，結(jié)果顯示，山海大模型對齊、智能體、安全等多項(xiàng)能力全球領(lǐng)跑。

發(fā)表于 10-12 14:30 ?275次閱讀

<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項(xiàng)能力全球領(lǐng)跑

云知聲山海大模型的訓(xùn)練優(yōu)化方法及應(yīng)用實(shí)踐

由AI大模型工場主辦的AI大模型生態(tài)暨算力大會(huì)在京舉行。作為國內(nèi)最具影響力與最懂大模型的AI生態(tài)大會(huì)，此次大會(huì)以「AI NATIVE，生成未來」為主題，圍繞大模型、算力、數(shù)據(jù)產(chǎn)業(yè)、基礎(chǔ)

發(fā)表于 10-12 14:12 ?150次閱讀

云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

近日，多模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單，云知聲山海多模態(tài)大模型UniGPT-mMed

發(fā)表于 10-12 14:09 ?172次閱讀

<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測評榜首

云知聲山海大模型醫(yī)療專業(yè)能力全球第一

近日，由上海AI實(shí)驗(yàn)室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單，繼4月份奪冠后，云知聲山海大

發(fā)表于 09-19 15:47 ?227次閱讀

云知聲山海大模型助力司法領(lǐng)域智慧化升級

近期，云知聲成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海大模型的司法領(lǐng)域應(yīng)用，極大提升了司法服務(wù)的可及性與便利性。這不僅是

發(fā)表于 09-12 14:44 ?526次閱讀

云知聲推出山海多模態(tài)大模型

在人工智能技術(shù)的浩瀚星海中，多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后，云知聲以創(chuàng)新之姿，推出了其匠心獨(dú)運(yùn)的山

發(fā)表于 08-27 15:20 ?319次閱讀

云知聲在邊緣側(cè)大模型技術(shù)探索和應(yīng)用

解決的課題。 2024高工智能汽車開發(fā)者大會(huì)暨艙駕智能與跨域論壇上，云知聲智慧座艙解決方案中心總經(jīng)理鮑晴峰以《邊緣側(cè)大模型帶來智能座艙交互新體驗(yàn)》為題，分享了

發(fā)表于 06-29 15:30 ?730次閱讀

云知聲攜手耘途教育成立云知學(xué)院福建分院，探索智慧教育新思路

近日，云知聲與耘途教育聯(lián)合成立云知學(xué)院福建分院，深入探索智慧教育新模式、新思路。

發(fā)表于 05-11 15:52 ?464次閱讀

【大語言模型：原理與工程實(shí)踐】探索《大語言模型原理與工程實(shí)踐》2.0

《大語言模型“原理與工程實(shí)踐”》是關(guān)于大語言模型內(nèi)在機(jī)理和應(yīng)用實(shí)踐的一次深入探索。作者不僅深入討論了理論，還提供了豐富的

發(fā)表于 05-07 10:30

云知聲山海大模型醫(yī)療行業(yè)版登頂上海AI實(shí)驗(yàn)室權(quán)威大模型評測榜

近日，上海AI實(shí)驗(yàn)室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單，云知聲山海大模型

發(fā)表于 04-24 14:28 ?1742次閱讀

攜山海大模型云知聲再赴港IPO

云知聲智能科技股份有限公司（簡稱“云知聲”）于3月15日更新了招股書，繼續(xù)其在港交所主板上市的步

發(fā)表于 03-22 14:51 ?620次閱讀

云知聲再闖港股IPO

近日，備受矚目的云知聲智能科技股份有限公司（以下簡稱云知聲）再次更新了其招股書，繼續(xù)穩(wěn)步推進(jìn)其在

發(fā)表于 03-22 14:42 ?602次閱讀

云知聲山海大模型獲得華為昇騰技術(shù)認(rèn)證

云知聲山海大模型近日取得了重大突破，順利通過了華為Atlas 800訓(xùn)練服務(wù)器和華為AI框架昇思MindSpore的兼容性測試。這一成就標(biāo)志

發(fā)表于 02-05 09:32 ?897次閱讀

云知聲推動(dòng)醫(yī)療產(chǎn)業(yè)數(shù)字化智能化發(fā)展

由億歐大健康主辦的CHS 2023第八屆中國大健康產(chǎn)業(yè)升級峰會(huì)在北京成功召開，活動(dòng)現(xiàn)場發(fā)布“CHS 2023中國大健康產(chǎn)業(yè)榜”系列榜單。憑借在醫(yī)療領(lǐng)域的大模型實(shí)踐探索，云

發(fā)表于 12-25 17:23 ?736次閱讀

云知聲山海大模型助力實(shí)現(xiàn)換乘節(jié)點(diǎn)無縫高效換乘

、出租車、網(wǎng)約車等多種出行方式于一體的大型綜合交通樞紐，是南寧對外銜接的主要門戶和窗口。此次南寧火車東站升級，是以云知聲山海大模型為核心，

發(fā)表于 10-31 09:27 ?957次閱讀

搜索歷史

云知聲山海大模型的創(chuàng)新應(yīng)用與實(shí)踐探索

評論

云知聲山海大模型多項(xiàng)能力全球領(lǐng)跑

云知聲山海大模型的訓(xùn)練優(yōu)化方法及應(yīng)用實(shí)踐

云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

云知聲山海大模型醫(yī)療專業(yè)能力全球第一

云知聲山海大模型助力司法領(lǐng)域智慧化升級

云知聲推出山海多模態(tài)大模型

云知聲在邊緣側(cè)大模型技術(shù)探索和應(yīng)用

云知聲攜手耘途教育成立云知學(xué)院福建分院，探索智慧教育新思路

【大語言模型：原理與工程實(shí)踐】探索《大語言模型原理與工程實(shí)踐》2.0

云知聲山海大模型醫(yī)療行業(yè)版登頂上海AI實(shí)驗(yàn)室權(quán)威大模型評測榜

攜山海大模型云知聲再赴港IPO

云知聲再闖港股IPO

云知聲山海大模型獲得華為昇騰技術(shù)認(rèn)證

云知聲推動(dòng)醫(yī)療產(chǎn)業(yè)數(shù)字化智能化發(fā)展

云知聲山海大模型助力實(shí)現(xiàn)換乘節(jié)點(diǎn)無縫高效換乘