模型与定价

本页面向使用者，说明费用是怎么算出来的。管理员侧的价格配置见计费体系。

计费单位

价格以 每百万（1M）token 为单位标注。模型可对不同维度分别定价：

维度	说明
输入（Input）	普通输入 token
输出（Output）	生成的输出 token
缓存输入（Cached Input）	命中提示缓存的输入 token，通常更便宜
缓存写入（Cache Write）	写入缓存的 token（含 1 小时档）
图像输入 / 输出	多模态图像 token
音频输入 / 输出	多模态音频 token

费用公式

单次请求的费用大致为：

基础费用 = Σ(各维度 token 数 × 对应单价 / 1,000,000)
最终费用 = 基础费用 × 分组倍率 × 渠道倍率

分组倍率 由你所属的用户分组决定，可能小于 1（优惠）或大于 1；属于多个分组时按平台设置合并（默认取最小值）；
渠道倍率 由请求最终命中的上游渠道/用户渠道决定。

阶梯定价

部分模型可能配置阶梯价格：按累计 token 量或其他条件，不同区间适用不同单价。最终账单会按命中的阶梯计算。你在调用时无需关心细节，平台会自动按阶梯结算并记录在日志中。

查看价格

网页「模型目录」：浏览所有对你开放的模型及其各维度价格；
GET /v1/models：以编程方式列出可用模型名（不含价格明细）；
如果管理员开启了公开定价端点，还可访问 GET /api/pricing 获取价格表。

费用记录

每次请求都会生成一条用量日志，包含各维度 token 数与最终费用。在「用量」页可逐条查看，详见用量与日志。

省钱建议

优先使用更便宜的小模型处理简单任务；
利用提示缓存（命中缓存输入价更低）；
控制 max_tokens 避免不必要的长输出；
关注自己所在分组的倍率。