模型

浏览和比较 AllToken 上可用的 AI 模型。

可用模型

AllToken 聚合了来自主流 AI 服务商的模型,统一通过单一 API 提供服务。每个模型在成本、速度、上下文窗口和功能方面各有特点。

模型页面 浏览完整目录,或通过 模型 API 以编程方式查询。

模型 ID

每个模型都有唯一的 ID。在 API 请求的 model 参数中使用:

示例
1const completion = await client.chat.completions.create({
2 model: 'claude-sonnet-4', // 模型 ID
3 messages: [{ role: 'user', content: '你好' }],
4});

常用模型 ID:

  • gpt-4o — OpenAI GPT-4o(多模态、快速)
  • claude-sonnet-4 — Anthropic Claude Sonnet 4(推理、编程)
  • deepseek-chat — DeepSeek Chat(高性价比)
  • deepseek-reasoner — DeepSeek Reasoner(扩展思考)
  • gemini-2.5-flash — Google Gemini 2.5 Flash(快速、多模态)

功能特性

不同模型支持不同的功能:

  • 文本 — 标准文本生成(所有模型)
  • 多模态 — 同时接受图片和文本输入
  • 推理 — 扩展思考 / 思维链
  • 函数调用 — 结构化工具使用
  • 联网搜索 — 实时访问互联网信息
  • JSON 模式 — 保证输出 JSON 格式
  • 流式响应 — 逐 token 的 SSE 响应

模型页面 按功能筛选,或查看模型详情页获取完整列表。

定价

模型按百万 token 计价(输入和输出分别计费),价格因模型和供应商而异:

  • 经济型(DeepSeek Chat)— 低至 $0.07 / $0.28 每百万 token
  • 中端型(Claude Haiku、GPT-4o mini)— $0.25-$1.00 每百万 token
  • 旗舰型(Claude Opus、GPT-4o)— $2.50-$15.00 每百万 token
  • 免费层 — 部分模型可免费使用,有速率限制

在每个模型的详情页查看实时定价,或使用 费用追踪 功能监控支出。

上下文窗口

上下文窗口是模型在单次请求中能处理的最大 token 数(输入 + 输出)。常见大小:

  • 128K tokens — GPT-4o、Claude Sonnet 4、DeepSeek Chat
  • 200K tokens — Claude Haiku 4.5、Claude Opus 4
  • 1M tokens — Claude Opus 4.6、Gemini 2.5 Pro

如果输入超过上下文窗口,请求会返回错误。请合理规划 prompt 长度,或对长文档使用摘要策略。