Search
Close this search box.

Openclaw 跟 GPT 有什麼不同?為什麼可以表現得這麼好? OpenClaw 原理大解密

隨著科技日新月異,我們正加速邁入全 AI 導向的時代。過去遇到難題,我們習慣訴諸 Google 搜尋海量資訊;如今只需打開 ChatGPT 輸入指令,精準的答案便手到擒來。然而,近期有一個專案橫空出世,不僅在 GitHub 上斬獲驚人的星數(Stars),更引發各大科技媒體瘋狂轉載,那就是 OpenClaw(小龍蝦)。

OpenClaw 是什麼?

OpenClaw 是由一名奧地利工程師 Peter Steinberger 所發明的,他發明理念是希望能夠打造一個「真正能做事的 AI」,幫助我們處理日常生活的大小事,像是你今天如果想要整理自己的郵件,你可以簡單的在自己的手機上,點開 LINE,發送給自己的 AI,請他幫你自動整理郵件,並且把不重要的郵件刪除,這樣簡短的一個動作,就可以幫助你處理好這個麻煩的事情。

Openclaw 背後的原理是使用了 Agent 的框架,這是他與 GPT 等等最不一樣的地方,他能夠不斷的自己產出內容,自行調用相關的工具,並且不斷的自我思考目前的結果是否已經符合使用者需求,進而再思考與修正。

另外,不同於 GPT,他能夠自行的操作使用者的電腦,這句話的意思是像說,如果今天他想要調用使用者電腦裡的資源時,他會去下指令(像是:ls, grep, cat 等等),去取得使用者電腦中的相關資源,這點可以大大的提升 OpenClaw 的能力,讓他能夠達成 GPT 無法達成的能力,徹底實現了讓 Openclaw 變成一個全面的電腦小助手。

OpenClaw 兩大關鍵能力:Context Window 分層讀取與Sub-Agent 模式

Openclaw(在功能面)本質上與市面上的 Agent 是相同的,他一樣是會有 LLM 以及 tools 讓 LLM 能夠去調用,但能夠讓他的能力脫穎而出的關鍵可以分成兩個部分:

一是在管理 Context Window (模型輸入的內容)時進行優化,例如時下最流行的 skill。

Skill是一個由 markdown 撰寫而成的檔案,他內部寫了整個完整的工作流,以及調用工具的相關邏輯,不過實際上,Openclaw 設計 LLM 在讀取這個 skill 時,並不是將一整份 skill.md 檔讀取,而是只讀取該檔案中 frontmatter 的資訊 (類似於簡短說明這個 skill 具體在做什麼,可見圖二)。

(圖二)上方為一個製作簡報的 skill,name 與 description 的區塊為 frontmatter。

如果今天 LLM 判定要去使用該 skill 時,他再將整份 skill.md 讀進去他的 context window 當中。因此,Openclaw 採用這種分層讀取的方式,能夠有效的減緩 LLM 很常遇到的一個大問題,那就是 Context Window 被塞滿了太多資訊,但有很多其實都不是很必要的,進而導致模型再判定是否要調用工具或者是輸出結果上,最終很常會有不符合我們預期的結果。

第二個能力則是內部有自行創建與管理(Sub-Agent)的模式,像是今天遇到一個比較複雜的問題時,不同於我們以往的 agent,只能依靠預先定義好每個 sub-agent 的職責,去進行調用與分派。OpenClaw 採用了動態創建 sub-agent 的方式,當今天問題他判定依照現有的 agent去處理太困難時,他會去把大任務拆解成小任務,並且去生成一個新的 sub-agent 去處理這個小任務,這樣的概念其實與人類遇到一個大型任務時,會去做的相關處理非常相似,而這樣的做法,也使得 OpenClaw 可以處理大型複雜的任務。

此外, OpenClaw 在長期對話中,仍然可以保有很好的能力,這是有賴於他內部有一套管理自己 memory 的方式。他採用的方法是,利用一個簡單的 markdown 檔去維護他現有的記憶,然後當他在與用戶對話的過程當中,判定有些內容是重要的,且需要長期記得的,那他就會自行調用工具去改寫這個 markdown檔,而當目前的 memory.md 的內容太長的時候,他會自行採用Summary 方式將記憶的內容進行壓縮,並把現有的內容用簡短的幾句話摘要。

這種 context engineering 的方式,讓他能夠把 context window 控制在健康的長度範圍中,使得 LLM 的能力能夠不受影響。

(圖三)agent 動態生成 sub_agent 去處理複雜任務的示意圖。

OpenClaw 的誕生,正標誌著我們正從 LLM(大語言模型) 時代,邁向真正的 Agent(AI 代理人) 時代

過去,我們驚嘆於 AI 能夠對答如流、博學多聞;而現在,我們追求的是 AI 能夠像一個專業的「數位員工」,理解複雜的工作流,並在關鍵時刻主動調用工具。OpenClaw 的優勢不在於它讀過更多書,而在於它更懂得分輕重緩急,透過精密的 Context 工程確保思考不跑偏,並利用 動態 Sub-agent 拆解難題。

當 AI 終於能從對話框走出來,開始替我們操作電腦、整理郵件、處理瑣事時,這不再只是科技的進步,而是生產力邏輯的徹底重構。在未來,我們或許不再只是「下指令」的人,而是「設定目標」的決策者。

(本文訊息由 CloudMile 萬里雲提供,內文與標題經 TechOrange 修訂後刊登。新聞稿 / 產品訊息提供,可寄至:[email protected],經編輯檯審核並評估合宜性後再行刊登。圖片來源:CloudMile 萬里雲。)