模型選擇
Filo Agent 支援在同一個工作流中切換不同模型:輕量任務可以使用更快、更高效的模型,複雜工作則可以切換到推理更強、上下文更長或支援多模態的模型。

快速選擇
先判斷目前任務類型,再選擇最適合的模型。
| 任務類型 | 模型 | 適合場景 |
|---|---|---|
| 日常郵件與問答 | Claude Haiku 4.5 | 高頻輕量任務、快速摘要、日常草稿、簡單問題 |
| 通用複雜工作 | Claude Sonnet 4.6 | 長文件理解、複雜郵件、跨工具分析、產品與程式碼判斷 |
| 進階推理 | GPT-5.5 / GPT-5.4 | 複雜規劃、關鍵審查、專業寫作、程式碼輔助 |
| 長文件、多模態與大型專案 | Gemini / DeepSeek / GLM | 長上下文分析、圖片、影片、截圖、大型程式碼庫、專案級執行 |
模型對比
Token 用量為相對等級。實際用量會受到上下文長度、快取命中和輸出長度影響。
| 模型 | 提供方 | Token 用量 | 適合場景 |
|---|---|---|---|
Claude Haiku 4.5 | Anthropic | 較低 | 快速摘要、短回覆草稿、輕量問答、低風險收件匣整理等日常高頻任務。 |
Claude Sonnet 4.6 | Anthropic | 中等 | 複雜郵件流程、文件分析、跨工具研究,以及大多數預設 Agent 工作。 |
GPT-5.4 | OpenAI | 中等 | 專業寫作、結構化推理、程式碼輔助,以及需要細緻判斷的任務。 |
GPT-5.5 | OpenAI | 最高 | 高風險規劃、深度程式碼工作、產品審查,以及複雜多步驟決策。 |
DeepSeek V4 Pro | DeepSeek | 最低 | 大型程式碼庫、自動化密集任務、技術整合,以及對成本敏感的長流程。 |
GLM 5.2 | Z.ai | 最低 | 工程工作流、工具密集執行、長時間 Agent 任務,以及結構化營運。 |
Gemini 3.1 Pro Preview | 中等 | PDF 理解、圖片或截圖分析、研究流程,以及多模態審閱。 | |
Gemini 3.5 Flash | 最低 | 快速長上下文閱讀、媒體輸入、廣泛探索,以及並行 Agent 工作。 |
如何選擇
日常工作優先選擇能夠勝任的最快模型;當任務需要更深推理、更長上下文或多模態理解時,再切換到更強模型。