你可能已經在用 ChatGPT 聊天、問問題了。
但你有沒有想過,AI 其實不只能回答文字,它還能幫你產檔案、記住你的工作習慣、串接其他工具、甚至自己規劃任務一路執行到完成?
這篇文章會用五個層級,帶你從最基本的 AI 聊天,一路認識到用 AI 產生檔案、記住你的工作習慣、串接外部工具,到最進階的 AI Agent 自動化。
每一層都建立在前一層的基礎上,所以順序很重要。
用 AI 聊天產生文字:ChatGPT、Claude 怎麼選?
這是大多數人最熟悉的用法。
你打開一個聊天視窗,輸入文字,AI 回覆文字給你。
不管是問問題、翻譯、寫文案、整理資料、甚至幫你想生日祝福怎麼寫,只要是「文字進、文字出」的事情,都屬於這一層。
這一層的重點很簡單:你問,AI 答。
常見的聊天工具有哪些?
目前最多人用的 AI 聊天工具主要有三個:
ChatGPT
ChatGPT 是最早被大家認識的 AI 聊天工具,由 OpenAI 推出。
它的優勢是使用者最多、生態系最完整,而且支援圖片生成和語音對話。
如果你是第一次接觸 AI,ChatGPT 通常是最容易上手的選擇。
Claude
Claude 是由 Anthropic 推出的 AI 聊天工具。
它的強項在於長文理解和邏輯推理,特別適合需要處理大量文字的工作,像是閱讀一份長篇報告再幫你抓重點,或是幫你寫一篇結構清楚的文章。
Perplexity
Perplexity 比較特別,它的定位更像是「AI 搜尋引擎」。
你問它一個問題,它不只會回答你,還會附上資料來源的連結,讓你可以自己去確認。
如果你常常需要查資料、做研究,Perplexity 會是很好的選擇。
這一層能幫你做什麼?
具體來說,AI 聊天可以幫你處理這些日常工作:
你可以把一段英文貼進去,請它翻譯成中文,還能指定語氣是正式還是口語。
你可以把會議記錄丟進去,請它幫你整理出重點和待辦事項。
你可以描述一個情境,請它幫你寫一封客戶回覆信。
你也可以把一個你不懂的技術概念貼進去,請它用簡單的方式解釋給你聽。
這些事情你當然可以自己做,但 AI 可以在幾秒鐘內給你一個不錯的初稿,讓你在這個基礎上修改,而不是從零開始。
AI 應用程式和模型有什麼不同?一張表搞懂
你可能已經注意到,AI 的世界裡有一大堆名字:ChatGPT、Claude、Gemini、DeepSeek、Grok⋯⋯看起來好像都是同一種東西,但其實它們分成兩類。
第一類叫做應用程式,就是你實際打開來用的那個軟體或網站。
第二類叫做模型,就是應用程式背後真正在思考、運算的 AI 大腦。
每個應用程式都有自己預設搭配的模型,以下是幾個常見的例子:
到這裡你可能覺得:「一個應用程式配一個模型,好像不難嘛。」
但讓人搞混的地方在於,應用程式和模型的關係並不是一對一這麼單純。
第一,一個應用程式可以切換不同的模型。
以 Antigravity(一個 AI 程式編輯器)為例,你打開它之後,可以自己選擇要用哪個模型來運算。
你可以選 Opus、選 Gemini、選 Codex,不同的模型各有強項。
同一個應用程式,換了不同的模型,回答的品質和風格都可能不一樣。
第二,反過來也成立:不同的應用程式,背後可能用的是同一個模型。
剛才提到的 Antigravity,其實是 Google 旗下的應用程式之一。
而 Google 旗下還有 Gemini、NotebookLM 等其他應用程式。
這些應用程式的介面不一樣、用途也不一樣,但背後都可以用 Google 自家的 Gemini 模型來運算。
所以你看到三個不同的名字,以為是三個不同的 AI 大腦,其實它們背後可能是同一顆。
簡單來說:一個應用程式可以換不同的模型,不同的應用程式也可能共用同一個模型。
所以下次看到一個新的 AI 名字時,先問自己一個問題:「這是一個應用程式?還是一個模型?」
把這個觀念分清楚,後面學起來會輕鬆很多。
用 AI 產生簡報、圖片、報告:什麼是 AI 檔案生成?
到了第二層,AI 不再只是回你一段文字,而是可以幫你「產出檔案」。
比如說,你請 AI 幫你做一份簡報、寫一份報告、生成一張圖片,這些都屬於檔案生成的範圍。
目前能幫你產生檔案的 AI 工具越來越多,這裡先介紹兩個代表性的。
它們都是 Anthropic 這間公司推出的應用程式,背後用的是跟 Claude 同一家的模型。
Claude Cowork(適合一般使用者)
它的介面就像一般的聊天視窗,但比起純聊天,它多了一個關鍵功能:你可以選定電腦裡的一個資料夾,讓 AI 直接對資料夾裡的檔案進行操作。
舉個例子,你手機拍了一堆照片丟到電腦裡,檔名都是 IMG_20250301_001 這種看不懂的格式。
你可以選定那個資料夾,然後跟 Claude Cowork 說「幫我把這些照片按日期重新命名」,它就會幫你批次處理完。
或是你可以跟它說「幫我做一份簡報」、「幫我寫一份報告」,它就會直接產出檔案讓你下載。
不需要寫程式,用說的就能完成。
Claude Code(適合工程師)
它是在終端機裡面運作的工具,你可以請它幫你寫程式、建立專案檔案、甚至跑測試。
它產出的不只是文字,而是可以直接執行的程式碼和檔案。
讓 AI 記住你的工作習慣:什麼是 AI 設定檔?
到目前為止,不管是聊天還是產生檔案,AI 每次對話都是從零開始的。
你可能有過這種經驗:昨天才跟 AI 花了一個小時討論專案方向,今天再打開一個新對話,它完全不記得昨天講過什麼,你得從頭再解釋一次。
它不知道你的專案長怎樣,不知道你的團隊用什麼技術,更不知道你做事的習慣。
更麻煩的是,目前的 AI 很難做到「只改一小部分」。
舉個例子,你用 AI 生成了一張海報,結果 Logo 放錯位置了。
你可能以為只要跟 AI 說「把 Logo 改到右上角」就好,但實際上 AI 會重新產生一整張新的海報,連你原本滿意的部分也可能跟著變掉。
每次都重新來過,又不記得你的偏好,結果就是你要反覆溝通、反覆調整。
但接下來這一層,可以大幅改善這個問題。
解法:用設定檔讓 AI 預先認識你的專案
靠的是「設定檔」。
做法是:你事先寫好一份文件,把專案的背景、使用的技術、做事的規則都寫進去。
AI 每次開始工作時都會先讀這份文件,就算是全新的對話,它也知道你的偏好和規則,產出的結果會更接近你要的樣子。
CLAUDE.md:讓 AI 認識你的專案
目前最常見的設定檔叫做 CLAUDE.md,最早是 Anthropic 在 Claude Code 這個工具裡推出的。
它的用途是告訴 AI:「這個專案是什麼?」
你可以在裡面寫上專案用了什麼技術、資料夾結構長怎樣、有哪些重要的規則。
CLAUDE.md 並不只屬於某一個應用程式。
除了 Claude Code 之外,像 Cursor 這類 AI 程式編輯器也支援讀取 CLAUDE.md。
不過,每個應用程式除了 CLAUDE.md 之外,通常還會有自己額外的設定方式:
以 Cursor 為例,除了讀取 CLAUDE.md 來認識專案之外,你還可以透過 Cursor 自己的規則系統(放在 .cursor/rules/ 資料夾裡),定義更細的工作指令。
例如:寫程式碼要遵守什麼風格、遇到錯誤要怎麼處理、commit message 要怎麼寫。
你可以把自己的工作經驗寫進這些規則裡,這樣 AI 就會照著你的做事方式來工作。
設定檔到底該寫什麼?
看到這裡你可能會想:「所以我到底該把什麼東西寫進 CLAUDE.md?」
舉個例子,假設你現在要請 AI 幫你修改購物車的結帳功能。
你可能會猶豫:我是要把「購物車怎麼結帳、怎麼扣庫存、怎麼算運費」這些細節寫進去?還是要把整個專案的架構都寫進去?
答案是:CLAUDE.md 寫的是整個專案的全貌,不是單一功能的細節。
因為 CLAUDE.md 的目的是讓 AI 「認識你的專案」,所以你要寫的是那些不管做什麼任務都需要知道的背景資訊。
具體來說,通常會包含這些內容:
專案基本資訊:這個專案是做什麼的、用了哪些技術(例如 Next.js + PostgreSQL)、主要的資料夾結構長怎樣。
開發規範:用什麼語言版本、命名規則是什麼、程式碼風格要遵守哪些標準。
常用指令:怎麼啟動開發環境、怎麼跑測試、怎麼部署。
重要的注意事項:有沒有哪些地方容易踩雷、哪些檔案不能亂動。
至於「購物車怎麼結帳、怎麼扣庫存」這種針對單一功能的細節,通常不需要放在 CLAUDE.md 裡面。
你只要在對話中跟 AI 說明當下的任務就好,AI 會結合 CLAUDE.md 裡的專案背景,加上你當下給的任務描述,來完成工作。
簡單來說,設定檔要解決的就是兩個問題:讓 AI 知道「這個專案是什麼」,以及「做事應該遵守什麼規則」。
任務的細節在對話中說明就好,不需要全部塞進設定檔裡。
讓 AI 操作 Figma、Google Calendar:MCP 和 Skill 是什麼?
到目前為止,你跟 AI 的互動都發生在同一個聊天視窗裡面:你打字,AI 回覆,頂多幫你產出一個檔案。
但這一層不一樣,AI 可以直接幫你去操作 Figma、Google Calendar 這些外部工具。
例如,你跟 AI 說「幫我在 Figma 上建一個新畫面」或「幫我在 Google Calendar 加一個會議」,AI 就真的會去執行。
這背後靠的是一個叫做 MCP(Model Context Protocol) 的機制。
MCP 是什麼?
簡單來說,MCP 就是一個讓 AI 可以呼叫外部工具 API 的機制。
當一個 AI 應用程式(例如 Claude、Antigravity)支援 MCP,你就可以透過設定檔告訴它:「你可以用 Figma、可以用 Google Calendar。」
之後你只要用文字下指令,AI 就會透過 MCP 去幫你操作那些工具。
MCP 的運作流程
MCP 的運作流程是這樣的:
- 你在自己的電腦上安裝一個 MCP Server(可以想成是一個小小的後端程式)。
- 當你輸入文字時,應用程式會把你的對話內容,加上 MCP 設定檔裡面的資訊,一起送進 AI 模型。
- AI 模型讀完之後,會選擇合適的工具,並且告訴應用程式要用什麼格式的資料去呼叫。
- 應用程式再去呼叫 MCP Server,由 MCP Server 真正執行動作。
MCP 的代價:很花 Token
MCP 有一個明顯的缺點:非常消耗 Token。
原因是每次你跟 AI 對話時,應用程式都會把 MCP 設定檔裡「所有工具的說明」一起送進 AI 模型。
一個 MCP 可能包含幾十種工具和選項,光是這些說明文字就會佔掉大量的 Context Token。
就算你只是問一個很簡單的問題,應用程式也得把所有工具的說明文字重新送給 AI 模型讀一遍才能回答,每次對話都會重複送出,Token 就是這樣被吃掉的。
改善方案:用 Skill 只載入需要的工具說明
MCP 的問題在於:不管你這次要用什麼工具,應用程式都會把「所有 MCP 工具的完整說明」一次全部送給 AI 模型。
Skill 的做法就是把這些說明拆開。
每個 Skill 代表一個獨立的功能,裡面會有一個 Name(名稱)和一個 Description(描述)。
舉個例子,一個負責操作 Google Calendar 的 Skill 可能長這樣:
Name: google-calendar
Description: 用來操作 Google Calendar 的工具。可以建立、修改、刪除行事曆上的事件。呼叫 Google Calendar API,資料格式為 JSON,必須包含事件標題、開始時間、結束時間。Name 讓 AI 知道這個功能叫什麼,Description 則詳細說明這個功能要怎麼用、要呼叫哪一支 API、資料格式是什麼。
這樣做的好處是:AI 不需要每次都讀完所有工具的說明,應用程式會根據你當下的需求,只載入相關的 Skill 就好。
舉個例子,如果你只是要請 AI 幫你在 Google Calendar 上建一個會議,應用程式只需要載入「Google Calendar」這個 Skill 的說明,而不用把 Figma、Slack、Notion 等其他工具的說明也一起送進去。
這樣就能大幅減少每次對話消耗的 Token。
CLAUDE.md、Skill、對話,各自該放什麼?
到這裡你可能會想:「CLAUDE.md 放專案背景、Skill 放工具說明,那像購物車結帳流程這種業務邏輯,到底該寫在哪裡?」
簡單整理一下:
CLAUDE.md:放整個專案的背景資訊,例如用了什麼技術、資料夾結構、開發規範。不管做什麼任務都會用到的資訊,就寫在這裡。
Skill:放外部工具的使用說明,例如怎麼呼叫 Google Calendar API、資料格式是什麼。這是給 AI 操作外部工具用的,跟你的業務邏輯無關。
對話:放當下這個任務的具體需求。例如「購物車結帳時要先檢查庫存,庫存不足要顯示提示訊息」這種細節,直接在對話中跟 AI 說就好。
AI 會把這三層資訊結合起來:從 CLAUDE.md 知道專案背景,從 Skill 知道可以用哪些工具,再根據你在對話中給的任務細節來完成工作。
什麼是 AI Agent?讓 AI 自己規劃任務並執行到完成
到了最後一層,AI 不再需要你一步一步下指令。
你只要給它一個目標,它就會自己規劃步驟、自己讀資料、自己執行、遇到錯誤自己修正,一路做到完成。
這就是所謂的 Agent 模式。
Agent 不需要額外設定
Agent 其實不是一個需要你另外安裝或設定的東西,它是工具裡面已經內建的模式。
以常見的工具來說:
Cursor:在 Chat 面板可以選擇 Agent mode,選了之後它就不只是回答問題,而是會自己去讀檔案、改程式碼、跑指令、看錯誤、再修正,一路做下去直到完成。
Claude Code:在終端機裡面本身就是 Agent 的運作方式,你給它一個任務,它會自己規劃步驟、讀程式碼、修改、跑測試。
Agent 的本質:設定檔 + 工具串接的自動化
Agent 說穿了,就是把「設定檔」和「工具串接」自動串起來。
設定檔做好(CLAUDE.md 和相關規則寫清楚)→ Agent 才知道你的專案長怎樣、做事該遵守什麼規則。
MCP 接好 → Agent 才有工具可以用。
如果你設定檔和工具串接沒做好就直接用 Agent,它就會像一個什麼都不知道的新人——有手有腳,但不知道公司規範,只會亂做一通。
使用 Agent 的正確步驟
- 先把 CLAUDE.md 寫好,讓 AI 認識你的專案。
- 把工作規則設定好,讓 AI 知道做事的流程和規則。
- 需要外部服務的話,把 MCP 接好。
- 然後開啟 Agent mode,給它一個明確的目標。
Agent 的品質,完全取決於你前面幾層打的地基。
進階用法:用 Subagent 打造 AI 團隊
當你熟悉了基本的 Agent 模式之後,還有一個更進階的玩法叫做 Subagent。
簡單來說,你可以建立多個不同角色的 AI Agent,每個角色負責不同的工作。
例如,你可以設定一個「前端工程師」Agent 專門處理畫面相關的程式碼,一個「後端工程師」Agent 專門處理 API 和資料庫,還有一個「程式碼審查員」Agent 負責檢查其他 Agent 寫的程式碼有沒有問題。
這些 Subagent 各自有獨立的設定和工作範圍,由一個主要的 Agent 來統籌分配任務。
這就像是你不只請了一個 AI 助手,而是組了一整個 AI 開發團隊,每個人各司其職。
不過 Subagent 屬於比較進階的用法,建議先把前面五個層級都搞熟之後再來挑戰。
AI 五個層級總整理:你該怎麼學?
這五個層級是一層一層往上蓋的。
第一層是基礎,Agent 是最進階的用法,但 Agent 能不能用得好,取決於你設定檔和工具串接有沒有打好地基。
所以如果你現在還在最基本的聊天階段,不用急,先把每一層搞清楚、做扎實,自然就能一步步走到 Agent 自動化的世界。