AI 成本治理:用量可见性 vs 单位经济
信号: AI 成本治理正在成为董事会层面的议题。企业采用 AI 的第一波重点是“获得使用权”:给员工配备 copilots,把模型连接到文档,在客服中运行试点,帮助工程师写代码,并测试智能体处理重复性运营流程。下一波重点则是“可见性”:谁在用哪些模型、处理什么任务、花费多少、带来什么业务结果?
这种转变是健康的。AI 支出不像传统软件支出。按席位计费的 SaaS 订阅通常比较可预测。而一个由模型驱动的流程,成本会随着提示词长度、上下文规模、检索量、工具调用、重试次数、图像生成、推理深度和智能体循环而变化。一个团队可能只是用模型总结短工单;另一个团队可能把庞大的知识库塞进长上下文提示;第三个团队可能在夜间运行自动评测。账单可能在财务真正理解使用模式之前就已经增长。
这就是为什么使用仪表盘、支出上限、内部成本分摊模型和 AI 可观测性工具正在受到关注。管理者想知道哪些团队在负责任地实验,哪些流程在消耗 token 却没有可衡量价值,哪些应用值得继续投资。这里的承诺不只是控制成本。更好的可见性也能改善产品决策。如果某项任务只有 5% 的情况需要高级模型,路由系统就可以把大多数请求交给更便宜的模型,只把昂贵推理留给模糊场景。如果一个流程反复失败并重试,解决方案可能是更好的数据、更清晰的提示、更窄的范围,或加入人工检查点,而不是投入更多算力。
这里还有一个战略信号。当 AI 从实验走向嵌入式产品功能时,成本会成为单位经济的一部分。每次对话花几分钱的聊天机器人,在高毛利企业客服中可能很容易证明合理;同样架构放到低毛利消费场景里可能完全不可行。一个能节省资深工程师时间的代码审查助手,可能值得使用高级模型;但一个为每份文档自动生成背景摘要的系统,可能需要批处理、缓存、小模型,甚至根本不需要模型。
换句话说,AI 成本治理不只是采购纪律,而是产品架构。它要求团队把模型选择、用户体验、延迟、准确性、风险和利润率连接成一个运营模型。
现实检验: 看见支出,并不等于控制了经济性。
第一个陷阱是仪表盘带来的安慰感。仪表盘可以显示 token 量、请求次数、供应商组合和团队成本,但它无法自动判断这些支出是否值得。一个高成本流程如果能防止欺诈、加快关键销售流程或减少专家劳动,可能非常优秀。一个低成本流程如果没人使用输出,或人类必须返工,也仍然是浪费。关键指标不是 AI 原始支出,而是每个有用结果的成本。
第二个陷阱是粗暴限制。有些组织看到发票上涨后,会禁止高级模型、缩小上下文窗口,或强迫所有团队使用最便宜的供应商。这可能降低账单,却损害可靠性。便宜模型如果产生更多错误、需要更多重试、增加审查负担或让用户沮丧,最终可能更贵。正确的问题不是“哪个模型最便宜?”而是“哪一种模型—路由—流程组合,能以最低总成本达到所需质量?”
第三个陷阱是隐藏的人力成本。AI 成本计算通常关注供应商发票,却忽略系统周围的人类工作:提示词维护、评测设计、异常处理、合规审查、支持工单、事件响应和用户培训。一个 token 成本看起来很低的流程,如果每十个输出就有一个需要升级处理,运营上可能很昂贵。可持续的 AI 经济性既包括算力成本,也包括人类监督成本。
第四个陷阱是智能体蔓延。智能体系统会因为规划、调用工具、检查结果、修订和再次尝试而放大成本。这对复杂任务可能有价值,但也可能制造不可见的循环。没有步骤预算、超时规则、任务边界和轨迹审查,智能体可能会花钱探索人类很快就会放弃的路径。自主性需要会计约束。
第五个陷阱是所有权薄弱。AI 支出常常夹在产品、工程、数据、安全和财务之间。如果没有人拥有从业务理由到模型路由再到结果衡量的完整链条,成本治理就会变成财务抱怨或工程清理任务。成功的团队会为每个 AI 流程指定负责人,并要求他们定义预期价值、可接受的每结果成本、质量阈值、回退路径和复盘节奏。
实际答案是把 AI 成本当作产品系统来管理,而不是当作水电账单。首先对流程分类:员工生产力、面向客户的自动化、决策支持、内容生成、工程辅助、监控和自主运营。每一类都需要不同的质量标准和风险控制。然后在流程层面衡量成本,而不只是模型层面。跟踪成功完成、升级处理、重试、延迟、用户采用、人类审查时间和业务影响。
团队也应该从一开始就为路由而设计。用较小模型处理常规分类、检索、格式化和草稿;用高级模型处理模糊性、高风险推理、综合分析和边缘情况。缓存重复上下文。修剪不必要的提示历史。把“知道了更好”的上下文与“决策关键”的证据分开。在错误代价高的地方加入人工检查点。更换供应商或模型版本之前先运行评测。
需要记住的关键点:
- AI 成本由使用方式塑造 —— 上下文规模、重试、工具调用和智能体循环,可能比席位数量更重要。
- 仪表盘只是起点 —— 真正有用的指标是每个可靠业务结果的成本,而不只是 token 量。
- 最便宜不一定更省钱 —— 更低的模型费用可能带来更高的审查、重试、支持或错误成本。
- 智能体需要预算 —— 自主性应该配套步骤限制、可追踪性和明确停止规则。
- 所有权决定纪律 —— 每个 AI 流程都需要有人对价值、质量、风险和成本负责。
结论: 信号是,AI 成本可见性正在快速成熟,因为企业已经不能再把模型使用当作小规模实验支出。现实检验是,可见性本身不能解决单位经济问题。可持续的 AI 采用,将来自流程层面的所有权、智能路由、评测纪律、人类监督设计,以及对每个有用结果成本的清晰认识。