如何從第一性原理看大模型Agent技術(shù)原理

隨著大規(guī)模模型技術(shù)的興起，我們正處于一個嶄新的智能時代的黎明。我們有一個大膽的預測，未來的5到10年將可能帶來一場大變局：99%的開發(fā)、設(shè)計和文字工作將被AI接管。這不僅僅是一個想象，而是對未來可能趨勢的深思熟慮。

在互聯(lián)網(wǎng)時代，我們目睹了大量網(wǎng)站的崛起，成為互聯(lián)網(wǎng)時代的原生應(yīng)用的主要載體，這個時代有了 Web 相關(guān)的新技術(shù)，這些技術(shù)承載著 Google、Facebook、Twitter 等互聯(lián)網(wǎng)明星企業(yè)的崛起。進入移動互聯(lián)網(wǎng)時代，App 成為了主要載體，它們占據(jù)了整個移動互聯(lián)網(wǎng)時代人們注意力的中心。然而，當我們進入智能時代，開始思考：什么將會成為這個時代的核心載體？我們預測可能不再是 App，也不再是網(wǎng)站，而是 Agent，也許幾年后的現(xiàn)實才能給出答案，但歷史告訴我們一個新鮮事物的演進總會找到一個穩(wěn)定的術(shù)語來概括這個載體，而今天我們看到 Agent 最具有這個潛力。

對于這個猜想，隨著我們后面講的越來越深入，大家可能體會也會越來越深，因為它可能抓住的一些智能時代一個非常本質(zhì)性的東西，基于大模型把 Agent 的能力推高到了一個全新的水平，這個在學術(shù)界研究了幾十年的全新物種才開始走入人類舞臺的中央。在范式上我們也在思考是什么樣的底層技術(shù)和架構(gòu)會驅(qū)動 Agent 技術(shù)的快速發(fā)展，從現(xiàn)在的趨勢來看，我們覺得在人類的智能原理處于核心地位的面向目標架構(gòu)很可能會成為驅(qū)動這個 Agent 技術(shù)發(fā)展的主要范式。

而且現(xiàn)在全球?qū)gent的關(guān)注也是非常狂熱的，幾個月前，OpenAI 在內(nèi)部就開始高度關(guān)注智能體（Agent）領(lǐng)域，Deep Mind的聯(lián)合創(chuàng)始人最近也提到下一代 AI 技術(shù)走向并非是生成性 AI，而應(yīng)該是交互性 AI。這種交互性 AI 在很大程度上類似我們今天提到的智能體，用戶要求完成各種任務(wù)，智能體則可以對軟件進行操作或者與人進行協(xié)作，完成相關(guān)的工作。

希望這些想法可以幫助大家在戰(zhàn)略層面或者是產(chǎn)品和技術(shù)層面得到一個很好的思考框架，能夠在各自的領(lǐng)域去推演未來。

導讀

走馬觀花、拋磚引玉

整個 PPT 一百多頁，內(nèi)容繁雜。我給大家做一個簡單的導讀，主要還是梳理脈絡(luò)，提出思考的框架和基點，起到拋磚引玉的作用，其中涉及的很多細節(jié)部分我們并沒有做得非常細致。期望大家在看完這個分享之后，對智能體技術(shù)有一個新的認知，并能應(yīng)用在你們自己的研究方向或者職業(yè)規(guī)劃上。

我們將整個內(nèi)容分為四個部分：首先，會對從大模型到現(xiàn)在的智能體的技術(shù)發(fā)展做一個串講；接著，介紹通用智能原理和面向目標架構(gòu)這個兩個根本性問題；最后，基于這兩個原理，分析現(xiàn)在的智能體架構(gòu)仍存在的缺陷，以及未來可能的發(fā)展方向。

1. LLM Agents綜述

如果你一直關(guān)注 AI 領(lǐng)域，你應(yīng)該能看到一個清晰的技術(shù)脈絡(luò)，一開始大家玩 Prompt 工程，接著是Prompt Chain或Flow，再到Agent，多Agent，很清晰的一個脈絡(luò)架構(gòu)，我們也會沿著這個脈絡(luò)給大家分享相關(guān)的經(jīng)典工作。

我們回到 Agent 這個概念上，實際上，人類是這個星球上最強大的 Agent。Agent是一個能感知并自主地采取行動的實體，這里的自主性極其關(guān)鍵，Agent要能夠?qū)崿F(xiàn)設(shè)定的目標，其中包括具備學習和獲取知識的能力以提高自身性能。

Agent 的復雜程度各不相同，一個簡單的恒溫器可以是一個 Agent，一個大型的國家或者一個生物群體也可能是個 Agent。感知環(huán)境、自主決策、具備行動能力，設(shè)定明確的目標和任務(wù)，適應(yīng)環(huán)境及學習能力，都是 Agent 的關(guān)鍵特點。

Agent 這一概念的起源并不明確，可以是學術(shù)界逐漸發(fā)展沉淀而來，但是我們可以考慮馬文·明斯基80年代《智能社會》這本書中在人工智能領(lǐng)域發(fā)揚光大了這個概念。Agent 理論在大模型時代之前已經(jīng)被學術(shù)界研究了很多年，甚至是汗牛充棟，許多理論研究都試圖創(chuàng)造出具有人類智能水平的 Agent。然而，在大模型出現(xiàn)之前，Agent 的技術(shù)始終面對天花板限制，無法取得實用的進步，它的本質(zhì)問題還是AGI問題，反過來說，只有AGI的技術(shù)進步才能讓 Agent 技術(shù)進步。

在學術(shù)領(lǐng)域，最經(jīng)典的案例可能是與機器人相關(guān)的研究，都涉及到了Agent 技術(shù)。在大模型時代之前，比較知名的垂直領(lǐng)域 Agent 的例子比如 Alphago，它有感知環(huán)境、做決策、采取行動的閉環(huán)，當時的主要研究方向還有使用強化學習打游戲的DeepMind的Agent57，后來更加通用的Gato，還有OpenAI玩“躲貓貓”的多智能體。

我們認為Agent技術(shù)是未來實現(xiàn)社會全面自動化的關(guān)鍵技術(shù)。在大模型出現(xiàn)之前，自動化更多的是一些偏結(jié)構(gòu)化固定模式環(huán)境中通過實現(xiàn)固定算法流程來完成自動化任務(wù)，而大模型智能體的通用性帶來了靈活性，使其可能應(yīng)對人類在腦力勞動中面臨的各種復雜長尾任務(wù)，進一步實現(xiàn)體力和腦力任務(wù)的全面自動化。

大模型和Agent技術(shù)開啟了全面自動化的新時代。大模型是第一個可以自主學習并擁有廣泛知識的模型，所以在大模型時代，Agent技術(shù)開始迅速發(fā)展。今天，我們可能只是在起點，我們看到的Agent還偏向于玩具，但是預計在未來幾年，這個領(lǐng)域?qū)a(chǎn)生極大的改變，它的發(fā)展速度可能會超越我們的想象，因為我們現(xiàn)在看到改進每天都在發(fā)生，天花板遠未來到，甚至天花板可能不會再來了。

1.1 Prompt工程

在大模型剛出來的時候，大家都喜歡做的事就是Prompt工程，把大模型當成一種編程語言來看待。人們通過描述角色技能、任務(wù)關(guān)鍵詞、任務(wù)目標及任務(wù)背景，告知大模型需要輸出的格式，并調(diào)用大模型進行輸出。這種方法就是經(jīng)典的把大模型當做工具來調(diào)用，我們可以稱為工具模式。

為此，大家也發(fā)展了各種各樣的Prompt工程的玩法，如角色扮演、零樣本提示和少樣本提示。比如一個澳大利亞少年編寫了一個15000個字符的提示詞，成功地讓他變身為人類的導師，教授各種知識。這種方式就像能直接構(gòu)建軟件一樣，是我們將Prompt工程發(fā)揮到極致的一個經(jīng)典案例。

https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor

1.2 Prompt外掛

僅憑Prompt工程根本無法滿足人們?nèi)找嬖鲩L的大模型需要，鑒于大模型本身的諸多缺陷，如不能及時更新知識，上下文有限等等，人們開始給大模型加入插件，如引入向量數(shù)據(jù)庫，把數(shù)據(jù)索引進向量數(shù)據(jù)庫，再召回數(shù)據(jù)，再提交給大模型做Prompt工程，這樣就可以使用最新的知識和比大模型里的知識更準確的知識。

這些還不夠，人們又開啟了外掛模式，嘗試讓 GPT 調(diào)用函數(shù)和使用工具，一系列關(guān)于工具使用的實踐開始出現(xiàn)，ChatGPT也推出了插件體系。當人們發(fā)現(xiàn)大模型的推理能力很差時，開始試圖讓模型自身清楚地描述問題，把問題轉(zhuǎn)化為 PDDL （Planning Domain Definition Language）格式的描述語言，通過調(diào)用通用規(guī)劃器來解決規(guī)劃問題，再把解決方案轉(zhuǎn)化為可執(zhí)行的動作，以更好地邏輯推理和規(guī)劃等任務(wù)。

更加經(jīng)典的外掛形式當然是讓大模型調(diào)用外部工具了，OpenAI也搞出了ChatGPT Plugins的開放體系，這些今天回頭看都是非常順理成章的形式，ChatGPT的爆發(fā)激發(fā)了全世界大量的Idea，這些創(chuàng)新很快就被OpenAI吸納進產(chǎn)品迭代中。

此外，大模型雖然具備一定的推理能力和思考能力，在很多推理任務(wù)上依然力不從心，能不能讓模型自己不做規(guī)劃推理，讓他把問題描述清楚，轉(zhuǎn)化成一個 PDDL 的一個關(guān)于規(guī)劃描述的語言，然后使用通用的規(guī)劃器去做規(guī)劃，再轉(zhuǎn)化成動作執(zhí)行，這就把大模型作為一個中轉(zhuǎn)器，把規(guī)劃器當做了一個外掛。

我們可能會思考，大模型或許真的就是我們以前想象的那樣，會達到人類智慧水平的普適性機器么？顯然從各項評測來看還有很多任務(wù)做不到，更何況這些任務(wù)評測本身的覆蓋度也不夠完備。

有一個經(jīng)典概念被譽為"通用任務(wù)解決器"，在達特茅斯會議之后得名“GPS”，即General Problem Solver。這是由赫伯特·西蒙（Herbert Simon）和艾倫·紐維爾（Allen Newell）在早期提出的概念，他們嘗試尋找可用于解決數(shù)學問題的通用解決方案。這套理念其實很簡潔，可以看作是早期的面向目標架構(gòu)。它的主要內(nèi)容是將目標狀態(tài)列出，然后在解空間中搜索可以將初始狀態(tài)轉(zhuǎn)化為目標狀態(tài)的操作組合，這樣的組合便是問題的答案。

1.3 分解與組合

然而，目前我們發(fā)現(xiàn)，在通用人工智能（AGI）的漫長旅途中，大模型雖顯強大，仍存在著顯著的技術(shù)天花板。許多人開始探索如何挖掘大模型在大任務(wù)執(zhí)行能力上的可能性，其中一個基本策略就是能夠分解和組合。例如，經(jīng)典的 MapReduce 模式可以將一個大型文本進行摘要，因為它的上下文有限，一種解決辦法是擴大 context 的范圍。另一個解決方案是，在有限的 context 中，我們先將文本拆分成小片段，對每個片段進行摘要，然后再將其組合，從而得出結(jié)果。

大家也發(fā)現(xiàn)大模型直接給出答案似乎并不靠譜，那么是否可以讓它像人類一樣，一步一步思考呢？畢竟，人類在解決問題時，也是逐漸構(gòu)建解決方案，而并非立即給出答案。因此，開始出現(xiàn)了一系列的嘗試解法，比如思維鏈、多思維鏈、思維樹和思維圖等。

我們一一講解，首先是思維鏈（Chain of Thought，CoT），它要求模型展示其思考過程，而非僅給出答案。這可以通過兩種方式實現(xiàn)，一種是具體說明，即要求模型詳細地、一步步地思考；另一種是示例說明，即通過給定問題和答案的同時，提供思考過程。這樣，當詢問模型時，模型會模仿此過程，逐漸思考并給出答案。再往后，我們發(fā)現(xiàn)一個CoT有時可能出現(xiàn)錯誤，然后開始嘗試讓它發(fā)散，嘗試多種思路來解決問題，然后投票選擇最佳答案，這就是CoT-SC了。

在這過程中，我們發(fā)現(xiàn)，這種發(fā)散的方法也有局限性，例如24點問題，它不能很好地解決，那么我們就會嘗試把這個問題進行垂直分解，分成三步來做，每一步分解成多個子問題，類似于動態(tài)規(guī)劃的做法，就好像把一個大任務(wù)拆解成了三個小的子任務(wù)，然后再一步一步地去實現(xiàn)它。

這就是思維樹（ToT， Tree of Thought）的一個主要思路，它會根據(jù)當前的問題分解出多個可能，然后每一個樹節(jié)點就是父節(jié)點的一個子問題，逐層擴散，遍布整個解空間，一些節(jié)點就直接會發(fā)現(xiàn)不合適而終止掉，達到了有效剪枝的作用。然而 ToT 的方式也存在問題，對于一些需要分解后再整合的問題，比如排序問題，排序你可能需要分解和排序，然后再merge，就不行了。

為了解決這個問題，一種名為思維圖（Graph of Tree，GoT）的方法被提出。這種思維圖既可以分解，也可以合并。

9月26日，清華姚期智團隊又提出了更新的方法——累計推理，在24點問題上成功率已經(jīng)達到98%的SOTA。他們方式很接近主流 Agent 的實現(xiàn)方式，具備一定的通用性。它首先會提出一個初步的想法，然后再對這個想法進行驗證，看這個提案是否合適。如果提案合適，就將它添加到圖的下一個節(jié)點，每一步都基于已經(jīng)建立的圖節(jié)點進行下一個思考節(jié)點的創(chuàng)建，這樣發(fā)散、合并或刪除直到達到最終目標狀態(tài)，完備性和靈活性大大增強。

1.4 反饋

上述的討論主要是任務(wù)分解和組合，他們盡管強大，卻不能與外界進行互動，這就不得不講到反饋機制了。反饋是整個控制論的基石，也是動物體從誕生之初就具備的基本能力。

最經(jīng)典的方法實際就是 ReACT，這個方法非常經(jīng)典，基本把智能體最核心的能力圈出來了，當然它也有它的缺陷，我們將在后面討論為什么還會有 Agent 更多的復雜技術(shù)以克服它的不足。ReACT讓大模型先進行思考，思考完再進行行動，然后根據(jù)行動的結(jié)果再進行觀察，再進行思考，這樣一步一步循環(huán)下去。這種行為模式基本上就是人類這樣的智能體主要模式。

比如，詢問一個關(guān)于科羅拉多造山帶的相關(guān)問題，它就會去通過搜索工具進行搜索，如果搜索結(jié)果沒有提到東部地區(qū)，它會繼續(xù)搜索東部地區(qū)的數(shù)據(jù)，然后繼續(xù)一步一步地思考，根據(jù)結(jié)果反復思考，直到完成這一項任務(wù)。

ChatGPT的代碼解釋器主要采用的就是這種模式。首先，代碼解釋器能夠與用戶進行簡單的互動，如用戶的問側(cè)和解釋器的回應(yīng)。當用戶的問題需要外部調(diào)用時，例如詢問天氣情況，解釋器會生成相應(yīng)的代碼，利用代碼調(diào)用外部工具獲取結(jié)果?；谶@些結(jié)果，代碼解釋器會將信息反饋給用戶，如“今天天氣很好”。下圖是，我們調(diào)研的ChatGPT Code Interpreter 的主要實現(xiàn)方式。

然而，我們始終覺得這樣仍然不夠，我們希望大模型在完成每一個任務(wù)后，能夠積累經(jīng)驗，故而產(chǎn)生了借鑒強化學習思路的"反射"機制。反射機制能夠讓機器記住每一次任務(wù)的完成情況，無論效果好壞，以供未來參考，提升模型的性能。

Agent的框架都會讓模型輸出JSON進行函數(shù)調(diào)用，OpenAI也就推出了Funtion Calling，將外部調(diào)用內(nèi)化到模型中，變成了一種原生能力。

考慮到前面說的ReACT和Reflection這些不徹底性，更大的變革轟然襲來，這就是Agent，今天4月AutoGPT橫空出世，短短數(shù)周Star數(shù)就超過PyTorch達到90k，賺足了眼球。

1.5 Agent

今天，全世界都在關(guān)注這個領(lǐng)域，Agent 模式的研究和應(yīng)用都在迅猛發(fā)展，作為一個"共識"可預見的未來該技術(shù)的進步將勢不可擋。AutoGPT模型剛在10月15日宣布獲得1200萬美金的資金支持，也小道消息稱OpenAI將在11月份發(fā)布面向 Agent 的原生模型和規(guī)范。百度在發(fā)布"文心一言4.0"時也表示，他們考慮在升級系統(tǒng)時重點考慮了系統(tǒng)2的能力，這也是Agent 模式的關(guān)鍵設(shè)計。

下圖是AutoGPT 發(fā)布的進行中的架構(gòu)圖，旨在實現(xiàn)對任務(wù)的有效管理。生成的任務(wù)將會被加入優(yōu)先級隊列中，隨后系統(tǒng)會不斷從優(yōu)先隊列中選擇優(yōu)先級最高的任務(wù)進行執(zhí)行，整個過程中，任何反饋都會通過記憶進行迭代優(yōu)化代碼。

這個主要框架雖然相對簡單，但其設(shè)計理念具有重要意義。首先，創(chuàng)建一個初始的計劃，然后進入主循環(huán)。系統(tǒng)會讓模型判斷在當前計劃下該進行何種行動，接著會執(zhí)行行動。執(zhí)行完畢后，結(jié)果會寫入下一次循環(huán)中。如此，每次決策都會基于之前的結(jié)果、記憶和計劃，從而制定出新的行動方案。

在該框架中，模型的決策過程涉及到動作選擇，這也是主要的功能之一。此外，整個過程中我們主要關(guān)注的一些工具包括“Start Another Agent”以及“Task Complete”。這兩個工具體現(xiàn)了Agent可以被調(diào)用，從而將大任務(wù)拆解為若干小任務(wù)進行處理，繼而形成層次化的樹狀結(jié)構(gòu)，這種結(jié)構(gòu)與人類分工和協(xié)作的工作方式極為相似。

值得一提的是，微軟的賈維斯 (Jarvis)一個深度學習任務(wù)調(diào)度系統(tǒng)，也采用了類似思想。他們主要關(guān)注如何調(diào)用模型來執(zhí)行各種深度學習任務(wù)，涉及到了先做計劃，再選擇模型，然后執(zhí)行任務(wù)，獲取反饋，然后進入下一輪循環(huán)等環(huán)節(jié)。

有的研究者會嘗試使用大模型寫小說，借鑒LSTM這個經(jīng)典深度網(wǎng)絡(luò)的思想發(fā)明RecurrentGPT，還引入了長時記憶和短時記憶機制，使模型擁有了更佳的記憶和學習功能。

其他方向，我們看到把大模型視作一個虛擬世界中的智能體，如MineCraft游戲中所設(shè)定的角色。這個角色可以沿著指定的路線，完成一些在環(huán)境中探索的任務(wù)，如建房子、挖礦、打怪等。這個角色首先需要被告知怎樣去執(zhí)行任務(wù)，例如自動訓練課程計劃的使用。然后逐步的完成任務(wù)，形成自己的執(zhí)行代碼庫、技能庫等，這樣就算是在以后遇到相似的任務(wù)，它都能快速調(diào)用已有的技能和經(jīng)驗來完成任務(wù)。某種意義上，這就是一種強化學習的方式。

這個方向的變化真的是一日千里，就在昨天，清華聯(lián)合面壁發(fā)布了XAgent，提出了雙循環(huán)機制在效果上碾壓了AutoGPT。這種機制中，外循環(huán)負責宏觀規(guī)劃，而內(nèi)循環(huán)則負責細節(jié)的執(zhí)行。

雙循環(huán)模式

在完成各類任務(wù)的時候，它的能力也大大勝過 GPT 4。這里需要解釋一下，研究者為什么把 GPT 4 和 Agent 進行對比，看起來GPT 4只是 Agent 的一個組件，自行車的輪子怎么能和自行車對比呢？這是因為從任務(wù)完成的視角看，GPT-4也是一種Agent，Agent的概念是大模型的超集，這也是為什么我們說智能時代的核心載體是 Agent 而不是大模型的原因，這個事物的發(fā)展形態(tài)終將會走到一個最穩(wěn)定的形態(tài)，這個形態(tài)目前看只有 Agent 最配這個顏值擔當。當能不大眾所接受的對等 Agent 含義的詞匯可能還在發(fā)明中，至少目前看伙伴、助手這些命名的水平都不夠高，讓我們拭目以待。

1.6 Multi-Agent

進一步，人們很自然地想到了多智能體（Multi-agent）模式， "斯坦福小鎮(zhèn)"開了一個好頭。在這個虛擬的小鎮(zhèn)里，每個角色都是一個單獨的智能體，每天依據(jù)制定的計劃按照設(shè)定的角色去活動和做事情，當他們相遇并交談時，他們的交談內(nèi)容會被存儲在記憶數(shù)據(jù)庫中，并在第二天的活動計劃中被回憶和引用，這一過程中就能涌現(xiàn)出許多頗有趣味性的社會學現(xiàn)象，我們成為群體智能的涌現(xiàn)。

再看今年7月份，一個被命名為MetaGPT的項目引起了廣泛關(guān)注，這個項目中定義了產(chǎn)品經(jīng)理、架構(gòu)師、項目管理員、工程師和質(zhì)量保證等角色，各角色之間通過相互協(xié)作，基本可以勝任完成500行左右代碼的小工程了。

很簡單的一個實現(xiàn)就能夠完成500行，后續(xù)改進后，是否有可能完成5000行或者是5萬行代碼的項目呢？譬如前兩天微軟剛發(fā)布的 Code Plan 項目已經(jīng)開始嘗試實施大型工程的改造計劃。

Meta GPT 最有價值的思想是借鑒人類社會中的協(xié)作方式，尤其是SOP，之于Agent 設(shè)計則平平無奇，也包括觀察、思考、狀態(tài)管理、任務(wù)行動以及結(jié)果反饋等等必備組件。

同樣的思路，清華開發(fā)了一個名為ChatDev的系統(tǒng)，進一步引入了CEO等角色，這里就不再展開描述。

值得一提的是，Agent 的應(yīng)用方向其實非常廣泛。比如 RPA 公司實在智能把 Agent 用于他們的產(chǎn)品調(diào)用常見桌面軟件，如淘寶網(wǎng)、釘釘，來自動完成桌面任務(wù)。

而任何一個 Agent 的實現(xiàn)，似乎共性都挺多，都需要有長短時記憶能力、工具使用能力、通信能力，甚至包括 SOP 的能力，自然而言就有人要做這樣的框架了，如 agents。

1.7 簡單的難題

盡管 GPT-4 等模型非常強大、Agent的發(fā)展似乎牛氣沖天，它們?nèi)匀粺o法滿足很多任務(wù)的需要，甚至一些在我們看來很簡單的任務(wù)都完成不了，比如我們構(gòu)造的這個任務(wù)：

給小學生展示一下兩數(shù)相加的每一步計算過程，如1135 + 78
答：計算詳細過程如下
5+8=13， 進位1
3+7+1=11， 進位1
一個數(shù)已經(jīng)加完，剩余數(shù)11 + 1 = 12
結(jié)果為：1211
下面請列出以下兩數(shù)的詳細計算過程：
81728738271872871871672 + 28781729836746721

我們必須明白，盡管AI在一定程度上模仿了人腦的工作方式，但實際上，機器人和人腦在處理信息時采用的策略有很大的不同。因此，即使在未來，我們也需要繼續(xù)改進 AI 框架，以解決這種差距。比如一個百萬位數(shù)的加法任務(wù)，GPT-4囿于token數(shù)的限制是不可能完成這個任務(wù)的，但人類缺可以，這恰是人類和AI需要彌補的Gap。我們進行了一些簡單的試驗，還沒有發(fā)現(xiàn)大模型和Agent能搞定這個任務(wù)。其中，ChatGPT4的Code Interpreter是表現(xiàn)最好的，因為它調(diào)用了外部計算器，但中間的過程描述還是發(fā)生了錯誤。如果你能做出來這個小作業(yè)，歡迎聯(lián)系我。

至此，我們已經(jīng)講述了大模型到 Agent 的發(fā)展歷程。接下來的時間，我們將從人類智能的視角，結(jié)合面向目標架構(gòu)的理念，分析 Agent 技術(shù)的本質(zhì)、存在的缺陷以及未來可能的發(fā)展方向。

2. 通用智能基本原理

首先我們來看看這個眾人熟知的認知飛輪，感知、認知、決策、行動，今天的人工智能代理更像是基于這個認知飛龍構(gòu)建的。但是從本質(zhì)上，人類智能遠比這復雜。

在漫長的進化歷史中，生物神經(jīng)網(wǎng)絡(luò)從簡單的條件反射逐漸進化到今天的主動預測，我們已經(jīng)可以在大腦中構(gòu)建世界模型，進行強大的推理和分析?？此品彪s的過程，實際上都發(fā)生在核心的架構(gòu)上，并且逐步完善。無論是工作記憶，還是人類處理語言的能力的誕生，這些都是智能的必不可少的元素，尤其是符號能力，對人類智能的發(fā)展有著不可替代的作用。

因此，讓我們先提出一個更為宏觀的問題，智能究竟是什么？我強烈推薦這本名為《預測算法》的書，它在20年發(fā)表，那一年，GPT 3也剛剛問世，我在閱讀之后，就有這樣一個感覺：生成模型是戰(zhàn)略正確的。在之前關(guān)于AGI的分享中，也提到過這個觀點，智能是通過預測來解決應(yīng)對世界的不確定性的，分享視頻參見這里https://www.bilibili.com/video/BV16h4y1w79A/

讓我們深入理解一下模擬的概念，當一個低等動物接觸到外界的刺激，它會收縮來逃避潛在的風險。這其實是一種模擬，只不過這個模擬反射神經(jīng)元對有些過于反應(yīng)敏銳，它假設(shè)所有的刺激都是潛在的危險。然而，對于人類來說，我們的模擬則更為精細。我們對世界進行建模，把世界以實體、關(guān)系、屬性描繪出來。然而，這也是我們認知的極限，我們只能理解一個對象化的世界，非對象化的世界我們無法理解。比如，當我們探索量子的時候，我們還常常用對事物進行對象化的方式去理解，但是發(fā)現(xiàn)我們的理解力有時候是有限的，因為量子世界的真相超出了人類認知能力的范圍，我們智能使用低維空間的投影去推斷它，就像我們無法在三維世界去想象十一維世界的樣子。

在過去的四十年里，科學家對認知架構(gòu)有很多深入的研究，并嘗試據(jù)此研發(fā)出通用人工智能，但天地不仁以萬物為芻狗，當前來看只有GPT系列模型距離實現(xiàn)通用人工智能最近，當然這些認知理論依然具有巨大的參考和指導意義。

深入地聊認知架構(gòu)和智能原理之前，我們必須要聊的是繞不開的《思考快與慢》，這是一本暢銷書，其后面的學術(shù)道理也十分受用。大腦中的系統(tǒng)1和系統(tǒng)2是我們所有人都熟知的，盡管在實際實現(xiàn)中，系統(tǒng)2可能由系統(tǒng)1涌現(xiàn)，但至少在表現(xiàn)上，我們的大腦看起來有兩個系統(tǒng)，系統(tǒng)1和系統(tǒng)2，分別負責不同的功能。知識和情感的快速反應(yīng)被稱為系統(tǒng)1，而邏輯性強、思考速度慢的反應(yīng)被稱為系統(tǒng)2。

接下來我們看看這些認知架構(gòu)中?，有一個叫做GWT(Global Workspace Theory，全局工作空間理論)，如下圖所示：

全局工作空間理論（GWT）是認知科學家伯納德·巴爾斯（Bernard Baars）和斯坦·富蘭克林（Stan Franklin）在20世紀80年代后期提出的一種意識思維框架。它被開發(fā)出來，以定性地解釋一系列有意識和無意識過程之間的匹配。GWT在建模意識和高級認知方面具有影響力，認為它們是從廣泛、并行的神經(jīng)過程中信息的競爭和集成流動中產(chǎn)生的。

系統(tǒng)1涵蓋了神經(jīng)網(wǎng)絡(luò)的外圍連接，涉及長期記憶、價值系統(tǒng)、感知運動控制相關(guān)的神經(jīng)網(wǎng)絡(luò)，系統(tǒng)2則是一個高度集中的“舞臺”，人類的有意識思考，如做數(shù)學題時，腦中想象數(shù)字相加的過程，都在這個舞臺上進行。這個舞臺叫全局工作空間，記憶在這個舞臺上被拉進來加工，然后被扔出去。LIDA (Learning Intelligent Distribution Agent) 受到多種計算范例的啟發(fā)，并且實現(xiàn)了GWT。認知模塊包括知覺關(guān)聯(lián)記憶，情景記憶，意識，程序性記憶和行動選擇。由 LIDA 架構(gòu)控制的認知機器人和軟件代理將能夠進行多種學習機制。

其實在大模型Agent技術(shù)出現(xiàn)之前，人們就已經(jīng)意識到，試圖集成各種深度學習模型以實現(xiàn)人工普遍智能（AGI）并不夠，還需要更高層次的認知模型。Lecun在思考AGI時對大模型的出現(xiàn)也提出過意見，它認為世界模型才是關(guān)鍵，但前兩天新的研究卻認為大模型中有世界模型。但毫無疑問的一點是，世界模型對于我們對世界的認知是非常關(guān)鍵的，無論大模型中是否包含世界的認知，Agent都必須對世界有準確的理解才能做出正確的決策。當模型不能正確運行時，決策就會出錯；只有當世界模型構(gòu)建的正確，才能選擇正確的模型，進而做出正確的決策。

總結(jié)一下，系統(tǒng)2包含意識、思考、符號主義、邏輯推理圖靈、機制結(jié)構(gòu)化和模型。而系統(tǒng)1包含快速思考、神經(jīng)網(wǎng)絡(luò)連接主義、長期記憶、深度學習、亞符號、潛意識和非結(jié)構(gòu)化數(shù)據(jù)。在構(gòu)建 Agent 時，可以參考這兩種系統(tǒng)的思維框架。在理解智能架構(gòu)的概念時，我們需要從記憶空間、符號系統(tǒng)、世界模型構(gòu)建與加工三個方向去考慮。記憶空間是基礎(chǔ)，符號系統(tǒng)是思考和推理的核心，而世界模型的構(gòu)建和加工則是其中最重要的環(huán)節(jié)。在現(xiàn)在的大模型中，如 GPT，雖然很多人認為它沒有符號系統(tǒng)，但我們認為，其內(nèi)部的注意力機制可能已經(jīng)在激活流轉(zhuǎn)過程中模擬了世界模型的加工過程，只是這個過程并不顯式，而且無法控制，只能通過Prompt工程引導它進行，但它會經(jīng)常跑偏。

我們通過學習掌握了對世界的知識，并針對感知數(shù)據(jù)嘗試在符號系統(tǒng)中構(gòu)建世界模型，進行預測和行動。如彈鋼琴這樣的行動，我們需要通過反復訓練，逐漸將運動序列內(nèi)化，變成肌肉記憶和反射。這些在系統(tǒng)2中反復出現(xiàn)的行為，會逐漸沉淀到系統(tǒng)1中。這個過程可以理解為一個“快捷通道”的形成過程，稱為Shortcut。

人的視覺識別過程是一個層次性的關(guān)系，從最初級的視覺皮層一直到更高級的皮層，從簡單的視覺邊緣特征到線條的方向性，再到線條之間的組合，如角等更高維特征的形成，直到形成物體的感知。這些物體的概念再對應(yīng)符號系統(tǒng)和自然語言的綁定，當圖像信息經(jīng)過解碼過程進入符號系統(tǒng)后，我們的關(guān)聯(lián)記憶會幫助我們召回數(shù)字等語義概念。

以人類做加法為例，假設(shè)我們要解決“219 + 13”的問題，這個過程可能會遇到一個看似相同的圖形，比如圖中有"13"和"B"的歧義。這就打破了現(xiàn)在很多人的想法，通常我們喜歡做前向過程，先使用一個視覺模型處理輸入，然后再將其輸出傳遞給大模型進行處理。實際上，人在理解這個場景時是一個雙向過程，首先有一些直覺的特征傳入到系統(tǒng)2，系統(tǒng)2會推斷這是一個做加法任務(wù)，并將看似“B”的圖形解釋為13，這個過程稱為Projection。例如，我們經(jīng)常從一些像素點中識別出人臉，這就是由上至下的功效發(fā)揮作用，這是對未來人工智能代理（Agent）的一種啟發(fā)。

另一個關(guān)鍵的能力是關(guān)聯(lián)記憶。當我們開始觀察某個物體時，比如進行加法操作時，我們的大腦并不會以固定模式運作。相反，我們的神經(jīng)網(wǎng)絡(luò)會并行運行，有的神經(jīng)網(wǎng)絡(luò)開始將加法的概念、數(shù)字的概念以及加法規(guī)則等各種信息激活，所有這些信息都會基于一個關(guān)聯(lián)網(wǎng)絡(luò)喚醒出來，這樣我們就可以開始下一步的工作。接下來就是所謂的結(jié)構(gòu)推理，我們會開始將這些符號結(jié)構(gòu)化，例如，如果它是一個三位數(shù)，我們就會開始理解它的每一位構(gòu)成整體和部分之間的關(guān)系。

當我們已經(jīng)理解到219 + 13是加法時，我們也會執(zhí)行Structure Inference得到結(jié)構(gòu)的認知A+B=C的兩位數(shù)加法結(jié)構(gòu)，并將219和A對應(yīng)上，13和B對應(yīng)上，這個過程就是Variable Binding了，我們將具體的實例與它的角色對應(yīng)上了。

接著我們要遵循加法規(guī)則進行運算以實現(xiàn)我們的目標——完成加法任務(wù)。根據(jù)我們打算完成的目標以及現(xiàn)在的狀態(tài)，我們需要規(guī)劃出達成目標所需要的具體步驟，即執(zhí)行加法規(guī)則。進入到這樣一個循環(huán)過程之中，我們會額外提到兩個概念，即"Shortcut"和"Exception"。

那么什么是Shortcut呢？當我們初次開始書寫數(shù)字時，速度往往很慢，但隨著練習，我們將逐漸寫得越來越快。這個過程實際上包含了一個叫做“Recoding”的過程，我們會將熟悉的操作或流程用神經(jīng)元重新表示，這樣就把一個復雜的操作簡化為了一個子任務(wù)，通過類似于傳參的方式控制一個子神經(jīng)網(wǎng)絡(luò)完成任務(wù)。比如開車，一開始，每個動作都需要集中注意力，嚴重依賴系統(tǒng)2，但是開了一段時間之后，就可以自如地進行了，這就是因為系統(tǒng)2的控制能力已經(jīng)被沉淀到了系統(tǒng)1里面，稱為Shortcut。

另一個重要的方面是異常處理能力，人類最強大的能力就是能夠隨時應(yīng)對異常。譬如，你在走路時突然被絆了一跤，你首先需要應(yīng)對的就是摔倒這個狀況，然后再回到原來的路線上繼續(xù)走。

因此，在執(zhí)行加法過程中，并不是由于一個細節(jié)被中斷或遇到各種異常，才開始執(zhí)行加法。我們會發(fā)現(xiàn)，在遇到各種問題時，我們總是會奔著目標勇往直前。人是一個運作著面向目標架構(gòu)的復雜過程。面向目標架構(gòu)是人類智能的一個核心機制，當然并不是唯一的。有時，我們也會沒有具體的目標或者說目標不是顯式的，比如citywalking，同時有一些底層的目標機制，諸如生存，這說明人的面向目標架構(gòu)要復雜許多。這就是我們不得不說的智能核心的面向目標架構(gòu)

3. 面向目標架構(gòu)

我們的情緒系統(tǒng)其實也在解決目標問題，例如，你會因為目標無法達成而生氣，因為目標可能無法達成焦慮，因為別阻礙你的目標而憤怒。顯而易見，許多情緒都與目標機制有所關(guān)聯(lián)。因此，這套面向目標的機制在人的智能運作中占有極其核心的地位。

讓我們通過一個簡單的模型來描述該機制。首先，我們需要對這個世界有理解，因此我們會在腦中構(gòu)建一個關(guān)于世界的模型。這個模型在結(jié)構(gòu)化之后，就會變成了當前世界狀態(tài)。而我們的目標是對應(yīng)的一個目標世界狀態(tài)。因此，人類就是在不停地消除當前狀態(tài)和目標狀態(tài)之間的差異，這個消除的過程就是目標驅(qū)動的過程。

在目標驅(qū)動的過程中，你開始嘗試去解決這個問題，消除這個差異，你也可能有現(xiàn)成的解決方案，直接動用已有的解決方案執(zhí)行已知的運動序列，也可能需要進行一定的思考，做出推理分析幫助你解決問題。

一旦你找到了一些執(zhí)行序列，這些序列可能會變成一個子序列，子序列里有子目標。每個子目標的執(zhí)行有可能是直接完成的，也可能需要進一步思考才能完成。正如我們可以看到，GPS這段代碼就是在為了達成某一個目標而工作，它會遍歷所有的目標，嘗試讓每一個目標都能夠達成，一旦達成就結(jié)束。有興趣的同學可以讀一下這個代碼，就是做暴力遍歷找出達到目標狀態(tài)的操作序列。??????????????

不過，像GPS這種理想的解決方案在現(xiàn)實世界中可能并不奏效，因為真實世界的解空間過于龐大，想想AlphaGo的故事就理解了，這也是為什么雖然此想法在理論上看起來很好，但在實際操作時卻無法實施。

但這種思考很有啟發(fā)，在Newell和Simon1972年出版的《Human Problem Solving》一書中，他們研究了人類如何解決問題，并意識到我們經(jīng)常進行手段-目的分析(means-ends)

舉一個例子：

"我想把兒子送到幼兒園。我現(xiàn)在的狀態(tài)和我想要的狀態(tài)之間有什么區(qū)別？其中一個是距離。

是什么因素會改變距離？我的汽車?？墒俏业钠噳牧?。要讓它工作需要什么？一個新電池。

哪里能買到新電池？汽車修理店。我想讓修理店為我安裝一個新電池，但店里不知道我需要一個新電池。問題出在哪里？是溝通的問題。什么能讓溝通變得容易？一部電話……以此類推。"

在計算機領(lǐng)域，有很多方法都與目標機制相關(guān)。例如，過程描述語言（PDL）就是一種經(jīng)典的方法，主要用于解決機器人問題。我們可以描述世界上的對象，它們當前的狀態(tài)是怎樣的，目標狀態(tài)是怎樣的，有哪些可以采取的操作，然后我們可以基于這些操作，使用規(guī)劃器尋找一個合適的運動序列來解決問題。

但在今天計算機領(lǐng)域的工程實踐中，人們更多采用的是面向過程架構(gòu)，無論是接口、函數(shù)、UI界面，還是組件，又或者是一個應(yīng)用程序，都是以接口的形式存在的。而這個接口實質(zhì)上是一種被調(diào)用的子流程，借此過程的完成，我們希望執(zhí)行結(jié)果符合我們的預期，但程序并不為結(jié)果負責。它解決的是過程和流程問題，系統(tǒng)內(nèi)沒有目標的概念。

當然，也存在一些以目標導向為核心理念的的軟件工程，例如聲明式編程，它只需要你描述你想要什么，而無需關(guān)心執(zhí)行的過程，像HTML和SQL便是其經(jīng)典例子。在這樣的架構(gòu)下，程序能夠自行尋找達成目標的方法。

然而問題在于，這種面向目標的架構(gòu)只能應(yīng)用于垂直領(lǐng)域，而無法普遍應(yīng)用到所有領(lǐng)域，只有在特定的領(lǐng)域內(nèi)才能發(fā)揮作用，這就限制了它的應(yīng)用范圍。

總的來說，盡管面向目標架構(gòu)在計算機領(lǐng)域有一席之地，但由于其只能在特定領(lǐng)域發(fā)揮作用，而無法解決所有領(lǐng)域的問題，因此它的應(yīng)用還是有所限制，更多出現(xiàn)在特定的DSL（領(lǐng)域特定語言）中，這種架構(gòu)的確也發(fā)揮了巨大的作用。在軟件工程的范式遷移中，我們發(fā)現(xiàn)面向過程架構(gòu)與面向目標架構(gòu)之間的重要區(qū)別點：隨著人類的生產(chǎn)方式的變化，軟件工程可能正逐步演化為智能體工程(Agent Engineering)；以前我們主導的生產(chǎn)方式是人類處于中心位，AI做輔助。而未來可能會變成以 AI 為中心，人類變?yōu)檩o助。由此，整個產(chǎn)品形態(tài)和平臺的構(gòu)成可能會發(fā)生這樣的轉(zhuǎn)變。

在這一轉(zhuǎn)變中，原本由人類主導的功能開發(fā)，逐漸演變?yōu)橐灾悄荏w為主要驅(qū)動力。傳統(tǒng)的用戶界面，由于其垂直的任務(wù)層級架構(gòu)，每一層都需要人類逐一生成，未來這個過程可能會被智能體自主生成并改良。此外，原本只能解決有限范圍的任務(wù)，未來的架構(gòu)則可以解決無限域的任務(wù)。就如同頭條這樣的平臺，它是一個信息的分發(fā)平臺。那么，是否會出現(xiàn)新的平臺模式？比如一種知識和世界模型的分發(fā)平臺。以前我們只能處理大量長尾數(shù)據(jù)，在未來可能能解決大量長尾任務(wù)。以前是廉價的規(guī)?；影嘿F的個性化，以后是廉價的規(guī)?；膫€性化。

4. 前瞻性分析

根據(jù)上面的分析，我們能看到 Agent 技術(shù)在未來的發(fā)展還有很大的提升空間。我認為，這些提升主要可以從幾個方向開始，包括引入中央執(zhí)行機構(gòu)、學習能力、輸入感知、輸出執(zhí)行、世界模型和記憶等幾個方面。這些構(gòu)成因素是完備非正交的，都對提升 AI 技術(shù)至關(guān)重要。

4.1 Central Executive

首先，中央執(zhí)行機構(gòu)，這是一個核心的概念，但常常被人們忽視?，F(xiàn)在的 Agent 只是一個規(guī)劃器，它負責做規(guī)劃。但實際上，這個流程中還存在很多未明確的問題，比如，是否存在一個內(nèi)部加工過程，以及這個過程是否透明可控等。一種可能的解決辦法是，將內(nèi)部加工過程外部化，用系統(tǒng)2包裹起來，使每一步細粒度的思考都可以展現(xiàn)出來。

其次是世界模型，現(xiàn)在的大模型只能輸入語言，顯然這樣是不夠的，進一步理解世界需要多模態(tài)輸入。這是我們在未來需要處理的關(guān)鍵問題。同樣地，對于時間和自身的身體運動控制的認知也需要能夠輸入到大模型里面去。我們觀察到，無論是自動駕駛汽車、大模型Agent，還是其他的諸多智能體模型，都已經(jīng)在應(yīng)用這種面向目標的架構(gòu)。目前的挑戰(zhàn)在于如何在細節(jié)上加以改進，如找出此架構(gòu)未能完成某些任務(wù)的原因，以及這些缺陷是源于大模型底層的子任務(wù)能力不足，還是需要對框架本身做出改進，比如增加更多的思考層次，或加入更多的內(nèi)部推演等。

另一個重要的問題是宏觀注意力。由于大模型的上下文限制，是否可以讓模型自身主動去探索外部世界，將其精力和注意力主動地投入到解答某些具有目標性的問題上去，實現(xiàn)主動的注意力機制？這不僅涉及到搜索和嘗試的問題，如針對一些無法思考出解決方案的情況，模型應(yīng)如何去進行嘗試，而且這些嘗試何時能夠帶來進步，以及如何去尋找更為優(yōu)秀的解決空間，進行推理和規(guī)劃。

4.2 Memory

值得注意的是，數(shù)學和邏輯學習也會涉及到上述問題，比如人類在很多情況下不擅長規(guī)劃，那么我們是否可以利用網(wǎng)絡(luò)和記憶機制來實現(xiàn)規(guī)劃的功能？這其中就涉及到記憶的內(nèi)化，也就是把大模型從外部世界獲取的經(jīng)驗轉(zhuǎn)化為內(nèi)部參數(shù)，或者說把這些經(jīng)驗轉(zhuǎn)化為內(nèi)存。

目前，我們依賴的記憶機制主要是把所有的信息存儲在歷史記錄里，然后在需要的時候進行召回。然而，這些信息并未經(jīng)過整理，在一些試圖整理記憶的嘗試中，我們發(fā)現(xiàn)人類是具有這種能力的。人類在獲得大量相關(guān)的知識后，不會簡單地把它們堆積在腦中，因為人的神經(jīng)元存儲空間是有限的。相反，人腦會通過海馬體進行整理，而在我們做夢時，大腦會重新構(gòu)造這些相關(guān)的知識，使得記憶網(wǎng)絡(luò)變得有序。

然而，現(xiàn)在我們怎么去實現(xiàn)這種能力？目前還未見到具有遺忘功能的模型，也就是刪掉一些垃圾信息或錯誤的信息。在大模型訓練過程中，產(chǎn)生了許多無用甚至是錯誤的信息，而我們在工作中只是采用了許多方式來規(guī)避這些錯誤的信息，但為什么不試圖去刪掉它們呢？如果能夠?qū)⑦@些信息替換為有價值的信息，那將是一件有價值的事。我注意到在人工智能領(lǐng)域中，對于長短時記憶與工作記憶，以及它們之間的關(guān)系討論并不深入，更常見的是，人們將長短時記憶簡化為向量數(shù)據(jù)庫。我想解決這個問題，嘗試對這兩者進行深層次的理解，并建立更完備，更正交的關(guān)系也很重要。

4.3 Sensory

當人工智能Agent融入人類生活后，它與我們的體驗和經(jīng)歷能否成為Agent自身的存儲內(nèi)容？如果可以，那么在未來，我們與Agent之間的互動將會變得更加實用，更加貼近現(xiàn)實生活，更加有溫度。

在輸入的問題上，我明確地看到了多模態(tài)輸入的必要性，同時，對于時間感知我認為也非常重要，時間性對于運動控制任務(wù)極其重要。引入多模態(tài)輸入后，我們還要解決一個自上而下的機制問題，就是Projection啟發(fā)的這個點，OCR嫁接術(shù)一定會在某類任務(wù)存在缺陷。

4.4 Motor

在交流方式上，我認為不應(yīng)僅僅依賴于語言，雖然現(xiàn)在的交流基本都是基于語言的，但是，語言是一個低帶寬且低效的通信工具。我在想，我們能否引入一種新的溝通方式 - 類似心靈感應(yīng)的方式，讓Agent在隱空間通信。

關(guān)于運動控制，當前的方式包括一些機器人應(yīng)用，都比較結(jié)構(gòu)化。但我認為，在未來，大模型的神經(jīng)網(wǎng)絡(luò)應(yīng)該可以直接連接到運動控制的神經(jīng)網(wǎng)絡(luò)，實現(xiàn)層次化控制，使得運動更為流暢，甚至比人類更為靈活。

在另一方面，運動控制也應(yīng)該是數(shù)據(jù)化的，而不是僅僅處于我們所說的”計劃者“的層面。如果有一個命令下達，神經(jīng)網(wǎng)絡(luò)應(yīng)該可以直接執(zhí)行。

除此之外，還有一些亞符號的控制，在大模型直接對接神經(jīng)網(wǎng)絡(luò)時，我們應(yīng)當避免通過語言來描述，因為我們可以通過這種方式得到的信息量會比通過語言描述來得多。

同時，也需要進行一些外部工具的優(yōu)化，讓現(xiàn)有的工具更適應(yīng)我們的需求，比如一些愿意為了方便Agent調(diào)用進行改造的工具服務(wù)商將會在新的價值網(wǎng)絡(luò)中占據(jù)一席之地，如一個旅游服務(wù)供應(yīng)商，加入下一代Agent平臺之后，Agent在完成用戶旅游類任務(wù)時可能會有限調(diào)用它，并使用類似Web3的技術(shù)進行價值分配。

4.5 Learning

任何一個產(chǎn)品，或者說Agent，都需要學習。學習的過程是十分重要的，尤其是模型需要學會對自身的可靠性進行判斷，知道自己知道什么，更重要的是，知道自己并不知道什么，不擅長什么，這將會對模型的發(fā)展產(chǎn)生重大影響。關(guān)于大型模型的優(yōu)化，我認為最關(guān)鍵的問題就在于模型需要明確自己的能力范圍。有些問題，大模型不能張口就來直接給出答案，過于逞能，它應(yīng)該經(jīng)過仔細的思考，保證任務(wù)目標的準確達成。

同時，我們也需要考慮模型的權(quán)威性問題。大模型可能從互聯(lián)網(wǎng)和垃圾信息中學到很多知識，但這并不意味著它在解決問題時能提供最權(quán)威、最佳的做法。我們需要把這個模型訓練到，即使是在面對垃圾信息輸入時，它也能輸出更好的、更有價值的解決方案。

另一方面，我們還需要考慮到模型的多樣性。很多時候，為了保證任務(wù)的有效執(zhí)行，我們往往會控制模型的溫度參數(shù)，以保持其輸出的穩(wěn)定性。但是，在保證模型正確性的同時，我們也不應(yīng)該忽略它的思維活躍度。我們應(yīng)允許智能體在解決任務(wù)時有更大的解空間，以便找到最優(yōu)的解決方案。

4.6 World Models

關(guān)于世界模型，我們需要注意的是，盡管模型的訓練數(shù)據(jù)中可能含有很多垃圾信息和錯誤信息，我們還需要讓模型具有辨別和整理這些信息的能力，以構(gòu)建一個無矛盾、統(tǒng)一的實體網(wǎng)絡(luò)，這一點鮮被提及，我認為現(xiàn)在黯然神傷的之前做知識圖譜的同學可以重點考慮一下這個方向。??????

在此基礎(chǔ)上，我們還需要讓模型具備推理能力。一個優(yōu)秀的智能體不應(yīng)該僅僅依賴于內(nèi)部推理，而應(yīng)該有能力借助外部推理，當然這個外部推理可以當做工具來使用。

最后，我們還必須強化模型的內(nèi)部思考機制。當調(diào)用一些有成本的接口時，模型不能只是“想到就做到”，而應(yīng)該有自我覺知的能力，或者叫Mental Simulation，預判自己的行動可能會帶來的結(jié)果，并在內(nèi)部進行糾錯，以保證行動的可靠性，這不同于Reflection是執(zhí)行后根據(jù)執(zhí)行結(jié)果再反思。進一步，我們可能更大的關(guān)注點應(yīng)該是它在家庭生活及現(xiàn)實社會中的應(yīng)用上，將其實現(xiàn)為實體化的機器人，那么動力學機制和時間性認知還是很重要的，而當前的大模型僅是一個簡單的循環(huán)調(diào)用，無法實現(xiàn)這方面的任務(wù)。

好，以上就是我對一些方向的淺顯思考。??????

最后，我們以偉人的一段話來結(jié)尾：Agent 技術(shù)，它是站在海岸遙望海中已經(jīng)看得見桅桿尖頭了的一只航船，它是立于高山之巔遠看東方已見光芒四射噴薄欲出的一輪朝日，它是躁動于母腹中的快要成熟了的一個嬰兒。

編輯：黃飛

閱讀全文

機器人(200958) 機器人(200958)
神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)
運動控制(32363) 運動控制(32363)
Agent(26497) Agent(26497)
大模型(810) 大模型(810)

大模型的“第一性原理”：技術(shù)創(chuàng)新與社會價值的接軌

抱一而為天下式，產(chǎn)業(yè)大模型的價值公式

2023-07-14 09:07:44

504

AI Agent爆發(fā)在即！深剖AI Agent技術(shù)原理及發(fā)展趨勢

中能夠自主地進行學習和改進。 ? AI Agent的工作方式類似于人類代理，它能夠接收輸入數(shù)據(jù)（例如傳感器信息、文本、圖像等），通過分析和處理這些數(shù)據(jù)，理解環(huán)境和任務(wù)要求，并做出相應(yīng)的決策和行動。 ? AI Agent 的技術(shù)原理及應(yīng)用案例 ? AI Agent和大模型

2024-01-12 01:01:00

2146

一種電子系統(tǒng)測試性模型的研究

【作者】：宋東;胡立華;朱道德;王傳清;【來源】：《測控技術(shù)》2010年03期【摘要】：測試性是系統(tǒng)和設(shè)備的一種便于測試和診斷的重要設(shè)計特性,對現(xiàn)代的航空電子設(shè)備、武器裝備等復雜系統(tǒng)的維護性、可靠性

2010-04-22 11:28:58

從Qos看三大通信技術(shù)

優(yōu)先級控制、流量控制、時延控制,同時分配一定的資源進行通訊補救，保證系統(tǒng)、信令、數(shù)據(jù)的可靠性。因此DDA技術(shù)有很高的QoS指標保證。QoS實時控制技術(shù)在了解整體網(wǎng)絡(luò)資源運行情況和策略，掌握資源管理信息的基礎(chǔ)上

2018-02-01 14:42:29

ARM系列 - - 存儲模型（一）

開銷。因為當某一個寫入操作未執(zhí)行完，其它的操作可能會全部暫停下來。所以現(xiàn)在大部分處理器都不會實現(xiàn)順序一致性，而是實現(xiàn)一些較為松弛的一致性模型。下面將根據(jù)從強到弱的限制程度排序，列舉幾種典型的存儲器模型

2022-04-11 15:42:37

【可靠性分析第一步】構(gòu)造可靠性模型

其可靠性結(jié)構(gòu)框圖卻是串聯(lián)的，因為任何一個環(huán)節(jié)發(fā)生故障，則整個電路將不發(fā)生諧振。　　對于串聯(lián)結(jié)構(gòu)模型的系統(tǒng)，系統(tǒng)的失效率為各功能器件（部件）失效率的代數(shù)和。若系統(tǒng)中的每一個部件又由幾種元件組成，每種

2016-09-03 15:47:58

何勉：第一性原理和精益敏捷的規(guī)模化實施

形式，而忘記了實質(zhì)。這算是個開頭，為第一性原理做一個鋪墊。今天我主要分享敏捷的規(guī)模化實施，會從以下四個方面進行分享：1、第一性原理2、產(chǎn)品開發(fā)的第一性原理3、精益和?捷的規(guī)?；窂?、以第一性原理檢驗

2018-01-26 10:10:13

基于模型設(shè)計的HDL代碼自動生成技術(shù)綜述

流程，一般包含幾個步驟：圖2-1 V流程設(shè)計步驟從整個基于模型的現(xiàn)代控制系統(tǒng)設(shè)計開發(fā)流程看，主要有兩大特點：第一，以系統(tǒng)數(shù)學模型為核心，充分發(fā)揮仿真技術(shù)的優(yōu)勢。該流程可以分為離線仿真 → 快速原型

2021-06-08 09:29:26

基于CMMI-ACQ的信息技術(shù)和服務(wù)安全采購模型

。最后從過程的角度分析了利用該模型如何對對文獻中的典型安全問題或風險等進行了問題解決和風險規(guī)避,可知SAMEC模型能夠幫助組織進行安全的信息技術(shù)和服務(wù)采購從而保證采購成功地完成。【關(guān)鍵詞】：軟件工程

2010-04-24 09:51:13

基于多Agent的傳感器管理系統(tǒng)研究與設(shè)計

瞬間的不一致，從而導致系統(tǒng)整體性能的下降。任務(wù)沖突和競爭使任務(wù)協(xié)調(diào)變得更加復雜?！　? 基于多Agent的傳感器管理系統(tǒng)　　Agent是來自于分布式人工智能的一個概念模型，通常是指具有目標、行為和知識

2018-11-14 15:50:32

基于多Agent系統(tǒng)的智能家庭網(wǎng)絡(luò)研究

基于多Agent系統(tǒng)的智能家庭網(wǎng)絡(luò)研究在分析家庭網(wǎng)絡(luò)智能化需求的基礎(chǔ)上，提出一種基于多Agent系統(tǒng)的智能家庭網(wǎng)絡(luò)MAIHN模型，用Agent實現(xiàn)不同功能單元的控制與管理，通過MAS技術(shù)的思想、方法

2009-06-14 00:22:04

基于移動agent虛擬儀器系統(tǒng)體系結(jié)構(gòu)模型

技術(shù)、示例簡單等優(yōu)勢，成為MAIVS系統(tǒng)研究設(shè)計的平臺。Aglets用純Java語言編寫，具有較好的健壯性和移動性。作為最早基于Java的商業(yè)化系統(tǒng)，它提供了一套簡單而全面的移動agent編程模型

2019-04-16 09:40:10

如何實現(xiàn)User-Agent

`最近在玩兒Labview做瀏覽器，發(fā)現(xiàn)個問題。首先默認瀏覽器是IE6的內(nèi)核，用倒是能用，但是現(xiàn)在很多站點已經(jīng)不支持了。所以會彈出對話框：所以想用User-Agent偽裝成別的瀏覽器，這個如何實現(xiàn)？試了在調(diào)用節(jié)點的Header里面寫User-Agent，然并卵，并沒有任何效果。`

2016-09-12 16:02:31

如何實現(xiàn)基于Agent技術(shù)的嵌入式智能設(shè)備測試？

如何實現(xiàn)基于Agent技術(shù)的嵌入式智能設(shè)備測試？基于Agent的嵌入式智能設(shè)備測試系統(tǒng)是如何構(gòu)成的？

2021-04-15 06:14:46

怎么看ST公司Linux MPU第一款芯片STM32MP157？

`怎么看ST公司Linux MPU第一款芯片STM32MP157？看到網(wǎng)絡(luò)上有基于這款芯片的MYC-YA157C核心板及開發(fā)板，產(chǎn)品介紹如下：1、全新的STM32MP1處理器，為高端HMI類產(chǎn)品量身定制2、多種功能接口，提供完善參考功能參考3、軟件資源及文檔資源豐富，高效的技術(shù)支持加速產(chǎn)品開發(fā)`

2019-09-26 11:35:27

總結(jié)一下Agent 663系列電源的控制

VC++開發(fā)常用功能一系列文章(歡迎訂閱，持續(xù)更新...）吉時利2306 KEITHLEY2306通訊測試程控電源程序控制支持雙通道控制：直接上代碼：自動化技術(shù)得到飛躍發(fā)展的今天，測試中各種儀表也

2021-12-31 07:23:17

數(shù)字IC驗證之“典型的UVM平臺結(jié)構(gòu)”（3）連載中...

的passitage模式，從圖中可以看出，每增加一個測試模塊，平臺中就會增加一個與之相對應(yīng)的agent，因為這些agent在測試單個模塊的時候已經(jīng)完成了，所以這里只需要將它們集成到一個env當中即可，這體現(xiàn)了uvm測試平臺的可重用性?！　”菊聝?nèi)容就介紹到這里?。?！　　未完（待更）.......

2021-01-22 15:32:04

樹莓派如何開發(fā)Agent

，配置了JADE(基于java的Agent開發(fā)框架)。各項測試都正常，但是使用兩臺樹莓派（都配置了JADE）進行遠程Agent之間的通信測試時，一直提示通信失敗。在嘗試了各種辦法（包括更改樹莓派主機名、固定IP地址、禁用IPV6）后仍然不能進行遠程通信。請高手解答?。。。。?！大恩不言謝?。。?！

2020-05-18 05:56:46

用IBIS模型對高速PCB進行信號完整性分析，出現(xiàn)報錯顯示沒有有效的連接器插針模型

信號完整性分析使用的軟件是Altium Designer ；我設(shè)計的PCB是一個連接板，器件包含三個不同型號的連接器，以及若干電容電阻，連接器分別連接了幾個芯片器件；我使用的IBIS模型借鑒于芯片

2019-05-26 15:45:31

系統(tǒng)的電磁兼容性分析模型及設(shè)計方法

：?? 第一層為有源器件的選型和印制板設(shè)計;?? 第二層為接地設(shè)計;?? 第三層為屏蔽設(shè)計;?? 第四層為濾波設(shè)計;?? 第五層為瞬態(tài)騷擾抑制;3.3 自頂向下方法本文整理自電子元件技術(shù)網(wǎng)和我愛方案網(wǎng)（聯(lián)手打造

2011-10-19 19:51:44

誠聘第一性原理計算兼職老師

企業(yè)培訓公司面向單位員工培訓，長期招聘第一性原理計算兼職老師，一般三天左右的短周期培訓，周末為主，有2人左右的小輔導，也有30人左右的培訓大班，待遇優(yōu)，北京，上海，成都，廣州，深圳等，如您想掙點外塊

2018-01-11 15:33:07

誠聘第一性原理計算兼職老師

2018-01-12 17:56:27

超算世界第一，中國第一？你們怎么看

超算世界第一，中國第一？神威*太湖之光，憑借這臺超算，中國又一次走到世界之巔，而且，這一次，中國憑借的是自己的技術(shù)。然而，中國真的是世界第一了么？我們來看一下：超算500強，中國上榜167臺，美國

2016-06-22 11:15:58

輕量級Agent平臺怎么測試？

多Agent系統(tǒng)是指由多個分布和并行工作的Agent通過協(xié)作完成某些任務(wù)或達到某些目標的計算系統(tǒng)。嵌入式多智能體是把嵌入式系統(tǒng)與多Agent相結(jié)合的技術(shù)，充分發(fā)揮了二者優(yōu)勢[1]。但是，多年來多

2019-09-27 06:26:11

MAS環(huán)境下實現(xiàn)Agent交互協(xié)作的關(guān)鍵技術(shù)

討論了MAS環(huán)境下實現(xiàn)Agent交互協(xié)作的關(guān)鍵性問題。在分析Agent協(xié)同設(shè)計目標的基礎(chǔ)上，將遺傳算法應(yīng)用于子任務(wù)的調(diào)度，提高了Agent協(xié)同工作的效率。應(yīng)用Agent的通信語言建立了一個

2009-02-21 11:50:18

基于使命的Agent組織模型

Agent組織是一種靈活有效的多Agent系統(tǒng)求解方式。針對目前Agent組織模型主要以利己型Agent為基礎(chǔ)的現(xiàn)狀，提出適合政府及軍事等領(lǐng)域使用的基于使命的Agent組織模型。模型以利他型Agen

2009-04-10 08:46:55

基于HLA和Agent的電子對抗仿真系統(tǒng)構(gòu)建

綜合運用基于HLA和Agent的建模仿真技術(shù)，設(shè)計開發(fā)分布式的仿真聯(lián)邦，研究基于HLA的Ageng通信控制、本體模型在Agent知識水平通信中的應(yīng)用以及提高HLA仿真效率途徑等問題。研究結(jié)果

2009-04-11 09:50:37

移動Agent位置透明通信模型的設(shè)計

提出一種高效可靠的移動Agent通信模型――D-C通信模型，結(jié)合域名字解析器和移動Agent系統(tǒng)中的Communicator實現(xiàn)移動Agent之間的通信。通過引入一種基于全局的、與位置無關(guān)的命名方法

2009-04-16 08:53:03

基于決策論的Agent個性化行為選擇

Agent 不同的主觀態(tài)度對行為策略的偏好具有重要影響，但Agent 的個性化態(tài)度難于在量化或符號化的數(shù)值決策模型中體現(xiàn)。該文參照定性決策理論，在現(xiàn)有效用最大化決策模型基礎(chǔ)

2009-04-18 08:39:18

一種用于多Agent系統(tǒng)的領(lǐng)域工程方法

現(xiàn)有的面向Agent的軟件工程方法沒有考慮多Agent系統(tǒng)中的橫切關(guān)切并且存在Agent概念過于抽象，不能有效地指導詳細設(shè)計和實現(xiàn)的問題。該文提出一個基于多Agent領(lǐng)域元模型MBGDE，開發(fā)

2009-04-21 09:35:33

一種基于多Agent系統(tǒng)的智能家庭網(wǎng)絡(luò)研究

在分析家庭網(wǎng)絡(luò)智能化需求的基礎(chǔ)上，提出一種基于多Agent系統(tǒng)的智能家庭網(wǎng)絡(luò)MAIHN模型，用Agent實現(xiàn)不同功能單元的控制與管理，通過MAS技術(shù)的思想、方法和體系建立智能家庭網(wǎng)

2009-04-26 18:17:51

Agent Technologies實現(xiàn)應(yīng)用流程再造

論文旨在研究自助服務(wù)系統(tǒng)應(yīng)用流程再造的設(shè)計與實現(xiàn)，并探索Agent 技術(shù)在其中的應(yīng)用。關(guān)鍵詞：Agent；流程再造；業(yè)務(wù)無關(guān)性；

2009-06-01 11:04:36

基于多Agent 技術(shù)的分布式測控系統(tǒng)研究

文章將智能Agent 技術(shù)應(yīng)用于分布式測控系統(tǒng)領(lǐng)域，實現(xiàn)分布式測控系統(tǒng)的智能化。對Agent 技術(shù)、多Agent 系統(tǒng)、分布式測控系統(tǒng)進行分析，指出基于多Agent 技術(shù)的分布式測控系統(tǒng)需要

2009-06-01 13:42:53

基于多Agent的洪水預報系統(tǒng)研究

在分析洪水預報方法及研究進展的基礎(chǔ)上，提出了一種基于多Agent（Multi-Agent）的新型體系結(jié)構(gòu)的洪水預報系統(tǒng)模型，給出了系統(tǒng)的整體結(jié)構(gòu)及預報節(jié)點MAS 結(jié)構(gòu)。簡要介紹了界面Ag

2009-06-06 14:05:14

基于Multi-Agent 的網(wǎng)絡(luò)入侵取證模型的設(shè)計

在分析網(wǎng)絡(luò)入侵取證和多Agent 技術(shù)的基礎(chǔ)上，提出了一個基于多Agent 的網(wǎng)絡(luò)入侵取證系統(tǒng)的模型，并詳細描述了入侵檢測與取證的過程和方法。將入侵檢測和計算機取證技術(shù)結(jié)合在

2009-06-10 11:18:21

基于移動Agent 的新型分布式入侵檢測系統(tǒng)

通過闡述入侵檢測系統(tǒng)的基本概念和移動Agent 的優(yōu)點，并將移動Agent 技術(shù)與分布式技術(shù)相結(jié)合，提出了一種基于移動Agent 的新型分布式入侵檢測系統(tǒng)DIDSBMA，它具有傳統(tǒng)入侵檢測技

2009-06-13 11:08:27

基于遺傳算法的多agent聯(lián)盟的生成

聯(lián)盟生成是多Agent 系統(tǒng)的一個關(guān)鍵問題，主要研究如何在多Agent 系統(tǒng)中動態(tài)生成面向任務(wù)的最優(yōu)Agent 聯(lián)盟。本文討論了Agent 聯(lián)盟的生成，并將遺傳算法應(yīng)用于Agent聯(lián)盟生成中，對

2009-06-15 11:25:17

基于移動agent網(wǎng)絡(luò)智能化服務(wù)模型

設(shè)計和實現(xiàn)了一個移動Agent 網(wǎng)絡(luò)信息智能化服務(wù)系統(tǒng)模型，它能根據(jù)用戶定義的要計算目標，自主地適應(yīng)Internet 環(huán)境，能實現(xiàn)網(wǎng)上信息和用戶信息個性化需求模式的自動匹配，

2009-06-17 10:31:01

Agent在數(shù)據(jù)分析平臺中的應(yīng)用研究

以數(shù)據(jù)分析平臺的建設(shè)為背景，深入分析了數(shù)據(jù)分析平臺的特點和需求，在此基礎(chǔ)上，結(jié)合Agent技術(shù)，提出了具有智能化、個性化、平臺化等特點的數(shù)據(jù)分析平臺多Agent 系統(tǒng)的模型，

2009-06-18 08:20:56

基于有色 Petri Net 的多Agent入侵檢測系統(tǒng)實現(xiàn)

在目前基于Agent 的分布式入侵檢測系統(tǒng)的設(shè)計中，主要的設(shè)計思路是依賴多Agent 聯(lián)盟合作機制，但在具體的工程實現(xiàn)中，卻難以找到一種恰當?shù)膶崿F(xiàn)模型。本文針對此問題，提出了

2009-06-20 08:58:07

基于OCC 的Agent情感模型研究

Agent不僅要具有邏輯推理能力，還應(yīng)當具有類似人類的情感能力。通過對情感理論的分析，提出了一個基于OCC的Agent情感模型，使Agent能夠模擬像人類一樣的認知能力和情感能力，從

2009-06-26 08:21:20

一個移動Agent安全旅行協(xié)議

本文提出了一種保護移動Agent 不受Agent 平臺攻擊的旅行協(xié)議。該協(xié)議基于Agent旅行的歷史記錄，在一定的條件下允許Agent 所有者檢測對Agent 代碼、狀態(tài)和執(zhí)行流的非法篡改。這個

2009-07-30 10:42:45

基于多Agent的MES任務(wù)調(diào)度的研究與設(shè)計

針對MES的生產(chǎn)管理的特征，利用Agent自主性、智能性等特點，提出基于多Agent的MES 任務(wù)調(diào)度模型，介紹該模型的結(jié)構(gòu)以及各部分Agent 的功能和特點。并使用遺傳算法對參與調(diào)度的

2009-07-30 11:20:58

基于多Agent的維修任務(wù)調(diào)度系統(tǒng)的研究

本文根據(jù)維修作業(yè)任務(wù)調(diào)度的復雜性，以及當前存在的問題,提出了基于Multi-Agent技術(shù)的維修作業(yè)任務(wù)調(diào)度系統(tǒng)，建立了基于管理Agent、任務(wù)Agent和資源Agent的系統(tǒng)模型，引入了規(guī)則調(diào)

2009-07-30 11:33:50

基于多Agent的智能網(wǎng)絡(luò)交規(guī)培訓系統(tǒng)設(shè)計

交規(guī)培訓是提高駕駛?cè)藛T素質(zhì)、保證交通安全的前提?；诙?b class="flag-6" style="color: red">Agent 技術(shù)構(gòu)建的智能網(wǎng)絡(luò)交規(guī)培訓系統(tǒng)模型采用B/S 三層結(jié)構(gòu)，其中的表示層和邏輯層分別由不同的Agent 群來實現(xiàn)，極

2009-08-05 09:24:53

基于Agent的分布式入侵檢測系統(tǒng)的研究與實現(xiàn)

本文通過借鑒智能代理(agent)技術(shù)，并結(jié)合XML 和安全通信技術(shù)，提出了一種具有兩層代理結(jié)構(gòu)的分布式入侵檢測系統(tǒng)模型，并設(shè)計實現(xiàn)了原型系統(tǒng)。該模型有多個域組成，域內(nèi)采用分

2009-08-07 14:31:41

基于MVC 模式構(gòu)建用戶界面Agent 的應(yīng)用研究

用戶界面是應(yīng)用軟件的重要組成部分，將智能Agent 應(yīng)用于用戶界面的設(shè)計已越來越廣泛。而使用面向?qū)ο?b class="flag-6" style="color: red">模型MVC（模型—視圖—控制器）可以提高設(shè)計效率。論文主要論述了基于Agent

2009-08-15 10:00:27

基于Agent的頻繁模式挖掘

頻繁模式挖掘是數(shù)據(jù)挖掘中的一個重要部分，現(xiàn)有的模型具有各自的優(yōu)點，但在智能性方面表現(xiàn)較差。對于已經(jīng)存在的Agent 系統(tǒng)，多數(shù)都是以語言的形式進行描述，本文對Agent 進

2009-08-21 08:23:34

基于XML、CORBA和Agent的分布式搜索模型研究

XML、CORBA 和Agent 各有優(yōu)勢，通過它們的結(jié)合，可以克服傳統(tǒng)分布式系統(tǒng)的不足。論文分析了傳統(tǒng)搜索引擎的不足，提出了一個基于XML、CORBA 和Agent 技術(shù)的分布式信息搜索模型。該系

2009-08-29 09:55:58

一種結(jié)合Multi-Agent的單點登錄模型

本文針對單點登錄技術(shù)（Single Sign-On SSO），結(jié)合網(wǎng)絡(luò)安全機制分析并指出目前各種SSO 模型的不足，提出基于broker（經(jīng)紀人）與Kerberos 混合認證的Multi-Agent（多代理）SSO 模型，采用

2009-08-29 11:24:22

基于Agent技術(shù)的決策模型協(xié)作問題研究

本文通過對模型進行Agent封裝，以及模型之間的協(xié)作，將決策算法選擇和算法中系數(shù)的確定問題通過評價模型的協(xié)作來解決，改變了傳統(tǒng)決策者憑經(jīng)驗選擇模型算法和算法系數(shù)的確定

2009-09-01 10:54:20

一個基于移動Agent的分布式入侵檢測系統(tǒng)模型

本文分析了當前分布式入侵檢測系統(tǒng)中存在的一般性缺陷，介紹了移動Agent的概念和優(yōu)點，提出一種新的基于移動Agent 的分布式入侵檢測系統(tǒng)模型DIDSMA。DIDSMA 采用分散的數(shù)據(jù)分

2009-09-03 08:12:39

一種面向Web服務(wù)復合的多agent協(xié)同系統(tǒng)設(shè)計

本文主要設(shè)計了一種新的Internet系統(tǒng)模型，面向Web服務(wù)復合的多agent協(xié)同系統(tǒng)（CoWEB）。首先，通過闡述“Web服務(wù)復合”這種新的分布計算應(yīng)用所具有的特點和需求，提出了使用agent構(gòu)

2009-09-03 09:28:32

基于多Agent的網(wǎng)絡(luò)安全風險評估系統(tǒng)模型

本文提出了一種基于多Agent 的網(wǎng)絡(luò)安全風險評估系統(tǒng)模型，詳細說明了該系統(tǒng)中各Agent 的組成結(jié)構(gòu)和功能，并對多Agent 系統(tǒng)模型運行流程進行了描述。最后通過Agent的通信機制說明了

2009-09-11 16:07:21

基于移動agent的信息協(xié)查業(yè)務(wù)仿真模型研究

根據(jù)移動Agent 在分布式數(shù)據(jù)查詢中的優(yōu)勢，該文提出了一個基于移動代理的分布式信息協(xié)作查詢仿真模型，有效的解決了服務(wù)端和節(jié)點端因為頻繁的交互產(chǎn)生的帶寬浪費問題，減

2009-09-12 16:17:44

Multi-Agent在工控系統(tǒng)中的應(yīng)用研究

近幾年來，Agent 和Multi-Agent 理論和現(xiàn)場總線技術(shù)有著快速的發(fā)展。本文對Agent 和Multi-Agent 理論和現(xiàn)場總線技術(shù)進行簡單介紹。并結(jié)合Multi-Agent 理論和現(xiàn)場總線技術(shù)，構(gòu)建一個基于

2009-09-12 16:45:35

基于移動Agent異構(gòu)網(wǎng)絡(luò)管理的分析與設(shè)計

本文結(jié)合目前國內(nèi)外有關(guān)移動Agent 在網(wǎng)絡(luò)管理中的應(yīng)用狀況，提出了基于移動Agent的異構(gòu)網(wǎng)絡(luò)管理結(jié)構(gòu)模型，并進行了性能分析和模擬試驗。實驗結(jié)果表明，基于移動Agent的異構(gòu)網(wǎng)

2009-09-14 14:18:42

多agent動態(tài)調(diào)度控制模型

結(jié)合多agent 理論和企業(yè)的生產(chǎn)實際，建立了一種多agent 動態(tài)調(diào)度控制模型MADSCM，詳細探討了MADSCM 中agent的邏輯模型和具體結(jié)構(gòu)，通過引入等待時間，提出了一種可以減少協(xié)商次數(shù)的

2009-09-16 09:49:06

計算機輔助審計的多Agent協(xié)作模型研究

文章提出了一種基于計算機輔助審計的多Agent 系統(tǒng)模型，分析了該模型中各模塊的組成特點，并著重探討了系統(tǒng)中各Agent 的功能、Agent 之間的協(xié)作關(guān)系以及審計Agent 的內(nèi)部結(jié)構(gòu)。該

2009-09-23 10:52:22

基于移動agent的網(wǎng)格環(huán)境的安全技術(shù)研究

本文闡述了網(wǎng)格環(huán)境的特點、安全需求和移動agent。針對移動agent 引入到網(wǎng)格環(huán)境中的應(yīng)用需求所產(chǎn)生的安全問題進行研究，提出了基于移動agent 的網(wǎng)格環(huán)境的安全體系結(jié)構(gòu)模型

2009-12-25 16:44:57

基于人格理論的情感agent模型及應(yīng)用

情感agent 的模型設(shè)計是人工智能領(lǐng)域的一個重要內(nèi)容，是計算機信息科學與生物學、心理學和社會學等不同領(lǐng)域內(nèi)容相結(jié)合的一項研究。通過對心理學中人格和情感概念的研究和探

2010-01-13 14:40:20

基于多Agent的I-MES在煙草企業(yè)中的實現(xiàn)

本文以面向敏捷企業(yè)的智能制造執(zhí)行系統(tǒng)(I-MES)為研究對象，采用多Agent 技術(shù)作為系統(tǒng)的實現(xiàn)形式，對系統(tǒng)的多 Agent組織結(jié)構(gòu)、系統(tǒng)中多Agent間的通信和協(xié)作機制以及多Agent的基于事

2010-02-22 14:42:58

基于多Agent的機車電路仿真及其實現(xiàn)

針對機車電路復雜的連鎖關(guān)系以及現(xiàn)有仿真建模方法存在的問題,本文提出了基于多Agent機車仿真建模方法,構(gòu)建了基于多Agent的仿真模型并在JADE平臺上仿真實現(xiàn),結(jié)果表明利用多Agent間

2010-02-24 15:55:49

基于移動Agent的P2P搜索方法研究

針對一般P2P網(wǎng)絡(luò)資源搜索方法的搜索效率低等確定,通過引入移動Agent技術(shù),提出了一種基于移動Agent的新的搜索方法。該搜索方法設(shè)計了一個確定Agent數(shù)量及路線的算法,并利用其進行

2010-02-26 14:29:16

一種基于Agent技術(shù)的入侵檢測系統(tǒng)模型

本文首先指出了將Agent技術(shù)應(yīng)用于入侵檢測系統(tǒng)的優(yōu)勢,依據(jù)入侵檢測系統(tǒng)的特點給出了主機的狀態(tài)轉(zhuǎn)換圖,并提出了一個入侵檢測模型,該模型的主機中有數(shù)據(jù)異常檢測Agent、特征提取A

2010-02-26 16:11:02

基于多Agent技術(shù)的油田智能防汛系統(tǒng)

本文分析了基于多Agent 的決策調(diào)度在防汛系統(tǒng)中應(yīng)用的可行性,給出了多Agent防汛決策調(diào)度系統(tǒng)的設(shè)計方案和軟硬件體系結(jié)構(gòu)，通過在油田防汛決策支持系統(tǒng)中的應(yīng)用，說明多Agent的體

2010-03-02 16:19:11

張傳奇 - Agent Faker TL-C一致性Cache的軟件測試框架 - 第一屆 RISC-V 中國峰會

AgentRISC-V

RISCV國際基金會發(fā)布于 2022-09-02 10:34:49

基于Agent的網(wǎng)絡(luò)協(xié)作學習環(huán)境的研究與設(shè)計

通過對個別化教學中的協(xié)作學習和領(lǐng)域知識庫的分析以及對多Agent協(xié)作技術(shù)原理進行研究，引入智能agent的網(wǎng)絡(luò)協(xié)作學習環(huán)境，提出并設(shè)計了基于智能Agent技術(shù)的網(wǎng)絡(luò)教學系統(tǒng)

2010-07-21 16:47:28

Agent在數(shù)據(jù)分析平臺中的應(yīng)用研究

2010-11-01 11:57:26

基于SNMP的OBS網(wǎng)絡(luò)網(wǎng)管嵌入式Agent設(shè)計

基于SNMP的OBS網(wǎng)絡(luò)網(wǎng)管嵌入式Agent設(shè)計圖2所示給出了OBS網(wǎng)管的基本模型[1]。從圖中可以看出，Agent主要負責處理3件事情[1,2]：1) Agent通

2009-03-04 11:20:33

1415

嵌入式移動數(shù)據(jù)庫與Agent技術(shù)原理及設(shè)計

嵌入式移動數(shù)據(jù)庫與Agent技術(shù)原理及設(shè)計概述：隨著網(wǎng)絡(luò)技術(shù)的迅速發(fā)展和不斷滲透，在任何地點和任何時候都能接入網(wǎng)絡(luò)獲取各種信息，必

2010-03-07 12:47:28

500

Agent技術(shù)在裝備維修人員保障決策模型中的應(yīng)用

1 Agent 基本概述　　1.1 基本概念　　目前學術(shù)界對 Agent 的定義多種多樣，難以形成一個統(tǒng)一確切的概念。Agent 的一般描述為:Agent 是一個具有自主性、社會性、反應(yīng)

2010-08-16 11:32:21

1130

基于CSCW和多Agent的電網(wǎng)調(diào)度協(xié)同工作模型

分析電網(wǎng)調(diào)度運行管理系統(tǒng)的工作特點，根據(jù)系統(tǒng)內(nèi)不同任務(wù)分工協(xié)作的要求，利用多Agent 技術(shù)將系統(tǒng)劃分成不同功能的模塊。提出了基于多Agent 的CSCW 環(huán)境下的一種電網(wǎng)調(diào)度協(xié)同工作

2011-05-28 10:57:43

基于Agent的遠程教學模型

結(jié)合Agent、數(shù)據(jù)庫、動態(tài)網(wǎng)頁等技術(shù)，提出一個基于 Agent 的遠程教學模型，較好地實現(xiàn)個性化學習和協(xié)作學習。這一模型將大部分Agent 散布放置在網(wǎng)絡(luò)空間上，且能動態(tài)增刪，合理地利

2011-06-07 16:59:07

Agent技術(shù)研究與分析

介紹了 Agent 和多Agent技術(shù)的背景和概念，比較了Agent系統(tǒng)和多Agent系統(tǒng)的體系結(jié)構(gòu)，著重分析了Agent的結(jié)構(gòu)，說明了多Agent系統(tǒng)中的各Agent之間用來進行知識交互的通信語言，最后列舉了

2011-06-08 16:03:25

基于Agent技術(shù)的機群智能構(gòu)造器的設(shè)計

提出了一種基于 Agent 技術(shù)的機群智能構(gòu)造器CIB 通過一種系統(tǒng)構(gòu)造機制CIB 實現(xiàn)了對機群系統(tǒng)的自動配置部署和引導從而構(gòu)造出用戶定制的機群系統(tǒng)同時它提供了遵循用戶心智模型的GUI

2011-09-26 15:31:16

[10.3.4]--3.智能Agent技術(shù)-應(yīng)用與平臺

Agent

學習電子知識發(fā)布于 2022-11-23 16:16:57

Agent智能人機接口技術(shù)

本文將agent 技術(shù)和方法應(yīng)用于人機接口, 并設(shè)計了一個決策支持系統(tǒng)中的基于Agent 的人機接口模型。

2012-01-10 11:46:11

1849

Agent制造系統(tǒng)的研究及應(yīng)用

近來，Agent 技術(shù)已被認為是進行分布式工業(yè)系統(tǒng)建模的一種重要方法，一些主要的美國制造企業(yè)和政府機構(gòu)認為基于Agent 的制造是美國制造業(yè)的未來。Agent 技術(shù)是設(shè)計與實施分布式智能制造環(huán)境

2017-10-12 14:31:17

基于多Agent的眾包任務(wù)推薦系統(tǒng)

為了讓眾包平臺用戶更方便準確地搜尋到合適任務(wù)，促進其能力水平提升，解決眾包任務(wù)推薦動態(tài)性等問題，提出了一種基于多Agent的眾包任務(wù)推薦系統(tǒng)。首先，基于眾包平臺建立多Agent任務(wù)推薦模型，提出

2017-11-21 15:36:15

多移動agent協(xié)作規(guī)劃模型

以agent負載能耗均衡度和網(wǎng)絡(luò)總能耗為指標構(gòu)建多移動agent協(xié)作規(guī)劃模型，為了盡可能延長網(wǎng)絡(luò)生存周期，給出基于網(wǎng)絡(luò)覆蓋率的節(jié)點休眠機制，在滿足WSN網(wǎng)絡(luò)覆蓋率要求的同時，采用較少節(jié)點處于工作狀態(tài)

2018-01-17 10:03:01

BMS如何按照馬斯克第一性原理來設(shè)計？

既然馬斯克利用第一性原理取得了諸多成功（除了特斯拉，還有SpaceX，最近獵鷹重型的發(fā)射回收也是這一理論的典型應(yīng)用），我們不妨向成功者學習，按照馬斯克的第一性原理，BMS應(yīng)該如何設(shè)計？

2018-03-19 16:36:33

8070

針對固體可靠而準確的穩(wěn)定性第一性原理的詳細概述

可靠而準確的穩(wěn)定性第一性原理計算對材料的合成、反應(yīng)性和性質(zhì)的研究至關(guān)重要，對于探索新的化學空間和難以觀察的相結(jié)構(gòu)來說也很重要。穩(wěn)定性涉及化學穩(wěn)定能力（不同化學環(huán)境中化學計量組成保持不變的能力）和結(jié)構(gòu)選擇（一定化學計量組成的晶體結(jié)構(gòu)取向）兩個方面，對于已知材料，可用實驗測量生成焓來預測。

2018-04-29 17:41:00

2280

伯克利那個會“18般武藝”的DeepMimic模型開源了！

整個DeepMimic所需要的input分為三部分：一個被稱為Character的Agent模型；希望Agent學習的參考動作（reference motion）；希望Agent完成的任務(wù)（task）所定義的reward function。

2018-10-19 09:06:28

4638

基于第一性原理計算高效獲得高精度分子動力學力場

費力，即需要從第一性原理計算數(shù)據(jù)庫中手動或隨機選擇數(shù)千個參考結(jié)構(gòu)來擬合。另外，在分子動力學模擬中，由于缺乏對模型不確定性的評估方法，將難以確定力場何時是可信賴的，從而導致結(jié)果的不可靠。

2020-06-24 10:20:30

5286

基于機器學習的晶體結(jié)構(gòu)搜索方法和第一性原理計算

孫建教授課題組用自行開發(fā)的基于機器學習的晶體結(jié)構(gòu)搜索方法和第一性原理計算，對氦和甲烷在高壓下的化合物，以及它們在高溫高壓下的物態(tài)進行了系統(tǒng)研究，得到了一系列令人驚奇的理論結(jié)果。他們預言，在高壓下，氦和甲烷能形成氦-甲烷比例為 3:1的穩(wěn)定化合物He3CH4。

2020-06-24 10:27:13

5436

互聯(lián)網(wǎng)醫(yī)療的特性和內(nèi)在動力/基石模型/第一性原理

第一性原理可以適用于任何行業(yè)任何領(lǐng)域，聽說“互聯(lián)網(wǎng)醫(yī)療”行業(yè)也適用這個，但究竟是什么呢？

2021-01-11 11:11:27

546

關(guān)于多Agent的容錯中間件失效處理系統(tǒng)的研究

針對敏感行業(yè)中分布式應(yīng)用的容錯需求問題，分析介紹Agent、多Agent系統(tǒng)和容錯中間件技術(shù)，根據(jù)Agent和中間件特性結(jié)

2021-05-20 18:16:36

1394

從馬斯克的第一性原理，談氣傳導藍牙耳機的技術(shù)初衷

，莫過于他一直信奉的“第一性原理”。馬斯克是怎么看第一性原理的呢？他有一句話是這樣說的：“我們運用第一性原理，而不是用比較思維去思考問題，這是非常重要的。我們在生活中總是傾向于比較，對別人已經(jīng)做過或者正在做的事情我們也都去做，這樣發(fā)展

2022-01-17 09:25:42

1957

第一性原理軟件攜手曙光智算共同助推材料創(chuàng)新

　　新材料領(lǐng)域被定位為國家重要戰(zhàn)略發(fā)展高地，而第一性原理計算則在其中承擔舉足輕重的作用。其從量子力學基本原理出發(fā)，實現(xiàn)材料模擬，無需真實實驗即可預測材料性質(zhì)。目前已經(jīng)廣泛應(yīng)用于化學、物理、生命科學和材料學等領(lǐng)域，是新材料研發(fā)的利器。

2022-05-19 20:36:42

1460

Nanodcal第一性原理輸運軟件與Pd(100)_CO結(jié)構(gòu)弛豫的展示研究

Nanodcal是一款基于非平衡態(tài)格林函數(shù)-密度泛函理論（NEGF - DFT）的第一性原理計算軟件，主要用于模擬器件材料中的非線性、非平衡的量子輸運過程，是目前國內(nèi)擁有自主知識產(chǎn)權(quán)的基于第一性原理的輸運軟件。可預測材料的電流 - 電壓特性、電子透射幾率等眾多輸運性質(zhì)。

2022-11-29 15:03:43

1270