Skip to content

模型与定价

本页面向使用者,说明费用是怎么算出来的。管理员侧的价格配置见 计费体系

计费单位

价格以 每百万(1M)token 为单位标注。模型可对不同维度分别定价:

维度说明
输入(Input)普通输入 token
输出(Output)生成的输出 token
缓存输入(Cached Input)命中提示缓存的输入 token,通常更便宜
缓存写入(Cache Write)写入缓存的 token(含 1 小时档)
图像输入 / 输出多模态图像 token
音频输入 / 输出多模态音频 token

费用公式

单次请求的费用大致为:

基础费用 = Σ(各维度 token 数 × 对应单价 / 1,000,000)
最终费用 = 基础费用 × 分组倍率 × 渠道倍率
  • 分组倍率 由你所属的用户分组决定,可能小于 1(优惠)或大于 1;属于多个分组时按平台设置合并(默认取最小值);
  • 渠道倍率 由请求最终命中的上游渠道/用户渠道决定。

阶梯定价

部分模型可能配置阶梯价格:按累计 token 量或其他条件,不同区间适用不同单价。最终账单会按命中的阶梯计算。你在调用时无需关心细节,平台会自动按阶梯结算并记录在日志中。

查看价格

  • 网页「模型目录」:浏览所有对你开放的模型及其各维度价格;
  • GET /v1/models:以编程方式列出可用模型名(不含价格明细);
  • 如果管理员开启了公开定价端点,还可访问 GET /api/pricing 获取价格表。

费用记录

每次请求都会生成一条用量日志,包含各维度 token 数与最终费用。在「用量」页可逐条查看,详见 用量与日志

省钱建议

  • 优先使用更便宜的小模型处理简单任务;
  • 利用提示缓存(命中缓存输入价更低);
  • 控制 max_tokens 避免不必要的长输出;
  • 关注自己所在分组的倍率。

基于 MIT 协议发布(社区版)