AI 時代的能力積木:拆解 Claude 的文件化 Skill 與 Gemini 的生態型 Tools
#thought#skills#claude#gemini#modularization
在 2026 年的 AI 工程領域,「能力封裝 (Skill Encapsulation)」 已經成為獨立於模型之外的顯學。我們不再討論如何對 AI 說話,而是討論如何為 AI 打造一套「插拔式」的特技包。
但有趣的是,Google 與 Anthropic 兩大陣營,對於「什麼是技能」有著截然不同的認知模型。
1. Claude 的邏輯:Skill 是一份「文件化入職指南」
在 Claude 生態中(特別是 Claude Code 或 Hermes Agent),技能是被 文件化 (Declarative) 的。
- 核心:SKILL.md:這是一個包含 YAML 元數據與 Markdown 指令的文章。
- 認知模型:技能是「給 AI 看的操作記憶」。它利用 AI 強大的閱讀與邏輯跟隨能力,在需要時才「進步揭示 (Progressive Disclosure)」詳細細節。
- 優勢:極致的模組化與可攜性。一個寫好的
SKILL.md可以像積木一樣,被不同的 Agent 所調用。
2. Gemini 的邏輯:Skill 是一種「原生能力擴展」
Google 的認知更偏向於 函數導引 (Function Calling) 與 原生整合。
- 核心:Tools & Extensions:技能通常是一套嚴謹的 JSON 定義或直接與 Google Cloud/Workspace 掛鉤的擴展。
- 認知模型:技能是「賦予 AI 的原生感官」。它強調的是與 Google 生態(搜尋、地圖、工作區)的無縫接軌。
- 優勢:極高的執行效率與多模態原生性。Gemini 可以直接透過「技能」處理視覺或音訊數據,而不需要額外的轉換。
💡 系統化思維:多對多 (Many-to-Many) 的顯學
無論是哪種流派,核心趨勢都是一致的:技能必須與代理人解耦。
- 一個 Agent 可以擁有多個 Skill:就像一個員工具備多種證照。
- 一個 Skill 可以被多個 Agent 使用:就像一套標準作業程序 (SOP) 可以訓練不同的員工。
這種獨立性正是本專區成立的原因。我們在這裡收集這些「能力積木」,不論它是 Claude 風格的 Markdown,還是 Gemini 風格的 Tools,我們都將其視為 AI 時代的高價值數位資產。
本文為 AI 研究導讀,旨在為 Skill 分區建立宏觀視野。