业务跑到一定规模都会长出同样一团:模型选择散落在各个服务里、提供方 ID 直接硬编码在环境变量、安全例外靠 commit message 解释。加一个新模型要发版,加一条新规则要开会。
策略路由把这些决策收回到一份声明式配置——安全团队能直接读,平台团队不用重新发布业务就能上线。
工作区、团队、成本中心、RBAC 角色、套餐等级。VIP 客户走质量优先模型;沙箱流量走成本优先。
PII 检测、代码识别、语种、token 数、应用自带的数据分级 header。按级别选择阻断、脱敏或降级到本地化模型。
调用方 IP、声明的区域、数据驻留承诺。境内用户只命中境内提供方;私有化流量保留在 VPC 内。
当月已用、月内时间、团队剩余预算。预算用到 80% 自动降级到便宜模型,95% 触发告警。
工作时间、值班轮转、发布冻结期。工作时间质量优先;夜间批处理任务成本优先。
业务发送的任意 header——功能开关、实验分组、客户等级——灵果 都可作为路由输入透传。
含 PII 的流量只能走 VPC 内开源模型;境内流量留在境内提供方;其余进入质量优先链路。
策略是 Git 仓库里的 YAML 文件。像其他配置一样用 diff 审查。
提 PR。安全 / 法务签字。CI 按 schema 校验语法,并在仿真器中验证。
用过去 24 小时的真实流量回放新策略。看看哪些请求会被路由到不同地方。
合并即生效。灵果 在 5 秒内热加载所有策略,业务无需重新发布。