模型与定价
本页面向使用者,说明费用是怎么算出来的。管理员侧的价格配置见 计费体系。
计费单位
价格以 每百万(1M)token 为单位标注。模型可对不同维度分别定价:
| 维度 | 说明 |
|---|---|
| 输入(Input) | 普通输入 token |
| 输出(Output) | 生成的输出 token |
| 缓存输入(Cached Input) | 命中提示缓存的输入 token,通常更便宜 |
| 缓存写入(Cache Write) | 写入缓存的 token(含 1 小时档) |
| 图像输入 / 输出 | 多模态图像 token |
| 音频输入 / 输出 | 多模态音频 token |
费用公式
单次请求的费用大致为:
基础费用 = Σ(各维度 token 数 × 对应单价 / 1,000,000)
最终费用 = 基础费用 × 分组倍率 × 渠道倍率- 分组倍率 由你所属的用户分组决定,可能小于 1(优惠)或大于 1;属于多个分组时按平台设置合并(默认取最小值);
- 渠道倍率 由请求最终命中的上游渠道/用户渠道决定。
阶梯定价
部分模型可能配置阶梯价格:按累计 token 量或其他条件,不同区间适用不同单价。最终账单会按命中的阶梯计算。你在调用时无需关心细节,平台会自动按阶梯结算并记录在日志中。
查看价格
- 网页「模型目录」:浏览所有对你开放的模型及其各维度价格;
GET /v1/models:以编程方式列出可用模型名(不含价格明细);- 如果管理员开启了公开定价端点,还可访问
GET /api/pricing获取价格表。
费用记录
每次请求都会生成一条用量日志,包含各维度 token 数与最终费用。在「用量」页可逐条查看,详见 用量与日志。
省钱建议
- 优先使用更便宜的小模型处理简单任务;
- 利用提示缓存(命中缓存输入价更低);
- 控制
max_tokens避免不必要的长输出; - 关注自己所在分组的倍率。