tools 4/20/2026

Grok Computer 與 Meta Muse Spark:視覺代理的新邊境

#desktop-ai#grok#meta#vision#agent

2026 年 4 月中旬,xAI 的 Grok 與 Meta 都針對「桌面視覺分析」釋出了具備代理能力的更新。

Grok Computer (像素控制):

不同於傳統 API 串接,Grok Computer 採用的是「讀取像素」的直覺邏輯。

  • 它能像人眼一樣看著螢幕上的 UI 元素。
  • 它甚至可以操控那些完全沒有 API 接口、早在 20 年前寫好的老舊內部軟體,透過視覺辨識來填表與導航。

Meta Muse Spark (視覺鏈):

Meta AI 的桌面端則推出了 “Contemplating (沉浸思考)” 模式。

  • 它擅長「視覺重構」:如果您上傳一張手繪的簡易電商佈局圖,Meta 桌面版能直接幫您將這張圖轉化為可互動的 HTML 原型。
  • 它能透過 Ray-Ban Meta 眼鏡的視覺聯通,在桌面端處理「您親眼看過」的實體工作任務。