AI 支出和流量不是线性关系。一个写错的 Agent 循环、一个周五上线的新功能、一个周末忘了关的实验——周一财务就来问了。
预算与限流把真实的预算约束装到 AI 流量上:硬上限在烧穿之前拦住流量,软告警在硬上限之前出声,分摊报表让每一笔成本落到对应的成本中心。
预算用到 80%,企业微信 / 钉钉 / 飞书机器人通知团队负责人;用到 95%,呼叫值班。流量不受影响——只是把成本异常前置到「人在回路中」。
预算耗尽时,自动切到成本优先路由。smart/cheap 之类的智能别名在不丢请求的前提下降低质量。
按团队、按路由、按工作区设置上限。触达后,请求返回结构化 429 与重置时间。服务不下线,但失控的循环停下了。
支出按工作区、团队、路由、模型自动汇总——用的是业务已经在发送的工作区 / 团队 header。可直接导出给财务,或在数据仓库里做 BI 分析。
data-science 组本月已用至预算 92%,今早已发出企微告警。若触达 100%,流量自动降级到 smart/cheap,直到月度预算重置。
支出按工作区、团队、路由、模型与业务自带标签自动汇总。可导出 CSV,或推送至用友、金蝶、企业财务中台或数据仓库。
按贵司成本中心结构拆分的明细表。交给财务,直接对账。
通过 REST 读取每次请求的成本、归属团队、命中提供方。自建看板亦可。
按小时批量同步元数据到贵司数仓,与已有财务维表 join。