模型选择
Filo Agent 支持在同一个工作流中切换不同模型:轻量任务可以使用更快、更高效的模型,复杂工作则可以切换到推理更强、上下文更长或支持多模态的模型。

快速选择
先判断当前任务类型,再选择最适合的模型。
| 任务类型 | 模型 | 适合场景 |
|---|---|---|
| 日常邮件与问答 | Claude Haiku 4.5 | 高频轻量任务、快速摘要、日常草稿、简单问题 |
| 通用复杂工作 | Claude Sonnet 4.6 | 长文档理解、复杂邮件、跨工具分析、产品与代码判断 |
| 高级推理 | GPT-5.5 / GPT-5.4 | 复杂规划、关键审查、专业写作、代码辅助 |
| 长文档、多模态与大型项目 | Gemini / DeepSeek / GLM | 长上下文分析、图片、视频、截图、大型代码库、项目级执行 |
模型对比
Token 用量为相对等级。实际用量会受到上下文长度、缓存命中和输出长度影响。
| 模型 | 提供方 | Token 用量 | 适合场景 |
|---|---|---|---|
Claude Haiku 4.5 | Anthropic | 较低 | 快速摘要、短回复草稿、轻量问答、低风险收件箱整理等日常高频任务。 |
Claude Sonnet 4.6 | Anthropic | 中等 | 复杂邮件流程、文档分析、跨工具研究,以及大多数默认 Agent 工作。 |
GPT-5.4 | OpenAI | 中等 | 专业写作、结构化推理、代码辅助,以及需要细致判断的任务。 |
GPT-5.5 | OpenAI | 最高 | 高风险规划、深度代码工作、产品审查,以及复杂多步骤决策。 |
DeepSeek V4 Pro | DeepSeek | 最低 | 大型代码库、自动化密集任务、技术综合,以及对成本敏感的长流程。 |
GLM 5.2 | Z.ai | 最低 | 工程工作流、工具密集执行、长时间 Agent 任务,以及结构化运营。 |
Gemini 3.1 Pro Preview | 中等 | PDF 理解、图片或截图分析、研究流程,以及多模态审阅。 | |
Gemini 3.5 Flash | 最低 | 快速长上下文阅读、媒体输入、广泛探索,以及并行 Agent 工作。 |
如何选择
日常工作优先选择能够胜任的最快模型;当任务需要更深推理、更长上下文或多模态理解时,再切换到更强模型。