企業 Agent 完整解剖:架構四層 × 記憶四層
#agents#architecture#memory#enterprise#MCP
一個聊天機器人和一個真正的企業 Agent,差在哪裡?差在架構的完整性。
第一層:Agent 的四大組件
完整的企業 Agent 並非只有一個會說話的 LLM,而是四個相互依存的系統:
🧠 大腦(LLM 核心)
負責推理、規劃與工具選擇。這是一切決策的發生地,但它有一個致命短板——天生無狀態,缺乏長期記憶。
👁️ 五官(輸入層)
將語音、文字、影像、API 事件轉為模型可理解的 tokens。輸入品質決定 Agent 理解人類意圖的上限——ASR、OCR 若品質不足,再強的模型也難以補救。
🦾 手腳(行動層)
真正改變系統狀態的地方:讀寫資料、調用 API、操作介面。這一層需要最小權限原則、稽核日誌與人類介入機制,因為行動是不可逆的。
🔧 工具(MCP 能力層)
透過 Model Context Protocol(MCP)將外部能力外掛化,讓 Agent 的能力可動態載入與擴展。這代表工具調用正走向產業標準化。
關鍵區隔:聊天機器人只有大腦,RPA 只有手腳,真正的 Agent 是四者整合的完整體系。
第二層:記憶系統——Agent 最被低估的組件
四大組件中,「大腦」的無狀態問題往往被忽視,卻是企業落地的核心瓶頸。
LLM 天生每次對話從零開始,這造成四個失能:
- 無法記住過去決策
- 無法延續長任務
- 無法建立用戶理解
- 無法從錯誤中學習
有 RAG 不等於有記憶。RAG 是資料檢索,記憶是跨呼叫的狀態與經驗累積。
認知科學啟發的四層記憶架構
| 層次 | 類型 | 內容 |
|---|---|---|
| L1 | Working Memory(工作記憶) | 當前對話與思考狀態 |
| L2 | Episodic Memory(事件記憶) | 任務歷史與操作紀錄 |
| L3 | Semantic Memory(語義記憶) | 文件與知識庫 |
| L4 | Procedural Memory(程序記憶) | SOP 與工作流程 |
真正的難題不在儲存,在判斷
記憶系統的核心挑戰:
- 什麼該記? 不是所有資訊都值得持久化
- 如何抽象? 原始記錄 vs. 精煉摘要
- 何時更新? 避免過時記憶干擾新任務
- 什麼該遺忘? 主動遺忘機制防止雜訊累積
結論
從組件架構到記憶系統,企業 Agent 的競爭力不在於模型規模,而在於設計的完整性。四大組件缺一不可,記憶系統的品質則決定 Agent 能否真正「成長」。
未來 AI 競爭的決勝點,藏在這些工程細節裡。