Grok Computer 與 Meta Muse Spark:視覺代理的新邊境
#desktop-ai#grok#meta#vision#agent
2026 年 4 月中旬,xAI 的 Grok 與 Meta 都針對「桌面視覺分析」釋出了具備代理能力的更新。
Grok Computer (像素控制):
不同於傳統 API 串接,Grok Computer 採用的是「讀取像素」的直覺邏輯。
- 它能像人眼一樣看著螢幕上的 UI 元素。
- 它甚至可以操控那些完全沒有 API 接口、早在 20 年前寫好的老舊內部軟體,透過視覺辨識來填表與導航。
Meta Muse Spark (視覺鏈):
Meta AI 的桌面端則推出了 “Contemplating (沉浸思考)” 模式。
- 它擅長「視覺重構」:如果您上傳一張手繪的簡易電商佈局圖,Meta 桌面版能直接幫您將這張圖轉化為可互動的 HTML 原型。
- 它能透過 Ray-Ban Meta 眼鏡的視覺聯通,在桌面端處理「您親眼看過」的實體工作任務。