模型选择

Filo Agent 支持在同一个工作流中切换不同模型：轻量任务可以使用更快、更高效的模型，复杂工作则可以切换到推理更强、上下文更长或支持多模态的模型。

快速选择

先判断当前任务类型，再选择最适合的模型。

Token 用量为相对等级。实际用量会受到上下文长度、缓存命中和输出长度影响。

模型	提供方	Token 用量	适合场景
Claude Haiku 4.5	Anthropic	较低	快速摘要、短回复草稿、轻量问答、低风险收件箱整理等日常高频任务。
Claude Sonnet 4.6	Anthropic	中等	复杂邮件流程、文档分析、跨工具研究，以及大多数默认 Agent 工作。
GPT-5.4	OpenAI	中等	专业写作、结构化推理、代码辅助，以及需要细致判断的任务。
GPT-5.5	OpenAI	最高	高风险规划、深度代码工作、产品审查，以及复杂多步骤决策。
DeepSeek V4 Pro	DeepSeek	最低	大型代码库、自动化密集任务、技术综合，以及对成本敏感的长流程。
GLM 5.2	Z.ai	最低	工程工作流、工具密集执行、长时间 Agent 任务，以及结构化运营。
Gemini 3.1 Pro Preview	Google	中等	PDF 理解、图片或截图分析、研究流程，以及多模态审阅。
Gemini 3.5 Flash	Google	最低	快速长上下文阅读、媒体输入、广泛探索，以及并行 Agent 工作。

日常工作优先选择能够胜任的最快模型；当任务需要更深推理、更长上下文或多模态理解时，再切换到更强模型。