AI Signals and Reality Checks

AI 成本治理：用量可见性 vs 单位经济

Kaizhi Tang

12 May 2026 • 7 min read

信号： AI 成本治理正在成为董事会层面的议题。企业采用 AI 的第一波重点是“获得使用权”：给员工配备 copilots，把模型连接到文档，在客服中运行试点，帮助工程师写代码，并测试智能体处理重复性运营流程。下一波重点则是“可见性”：谁在用哪些模型、处理什么任务、花费多少、带来什么业务结果？

这种转变是健康的。AI 支出不像传统软件支出。按席位计费的 SaaS 订阅通常比较可预测。而一个由模型驱动的流程，成本会随着提示词长度、上下文规模、检索量、工具调用、重试次数、图像生成、推理深度和智能体循环而变化。一个团队可能只是用模型总结短工单；另一个团队可能把庞大的知识库塞进长上下文提示；第三个团队可能在夜间运行自动评测。账单可能在财务真正理解使用模式之前就已经增长。

这就是为什么使用仪表盘、支出上限、内部成本分摊模型和 AI 可观测性工具正在受到关注。管理者想知道哪些团队在负责任地实验，哪些流程在消耗 token 却没有可衡量价值，哪些应用值得继续投资。这里的承诺不只是控制成本。更好的可见性也能改善产品决策。如果某项任务只有 5% 的情况需要高级模型，路由系统就可以把大多数请求交给更便宜的模型，只把昂贵推理留给模糊场景。如果一个流程反复失败并重试，解决方案可能是更好的数据、更清晰的提示、更窄的范围，或加入人工检查点，而不是投入更多算力。

这里还有一个战略信号。当 AI 从实验走向嵌入式产品功能时，成本会成为单位经济的一部分。每次对话花几分钱的聊天机器人，在高毛利企业客服中可能很容易证明合理；同样架构放到低毛利消费场景里可能完全不可行。一个能节省资深工程师时间的代码审查助手，可能值得使用高级模型；但一个为每份文档自动生成背景摘要的系统，可能需要批处理、缓存、小模型，甚至根本不需要模型。

换句话说，AI 成本治理不只是采购纪律，而是产品架构。它要求团队把模型选择、用户体验、延迟、准确性、风险和利润率连接成一个运营模型。

现实检验： 看见支出，并不等于控制了经济性。

第一个陷阱是仪表盘带来的安慰感。仪表盘可以显示 token 量、请求次数、供应商组合和团队成本，但它无法自动判断这些支出是否值得。一个高成本流程如果能防止欺诈、加快关键销售流程或减少专家劳动，可能非常优秀。一个低成本流程如果没人使用输出，或人类必须返工，也仍然是浪费。关键指标不是 AI 原始支出，而是每个有用结果的成本。

第二个陷阱是粗暴限制。有些组织看到发票上涨后，会禁止高级模型、缩小上下文窗口，或强迫所有团队使用最便宜的供应商。这可能降低账单，却损害可靠性。便宜模型如果产生更多错误、需要更多重试、增加审查负担或让用户沮丧，最终可能更贵。正确的问题不是“哪个模型最便宜？”而是“哪一种模型—路由—流程组合，能以最低总成本达到所需质量？”

第三个陷阱是隐藏的人力成本。AI 成本计算通常关注供应商发票，却忽略系统周围的人类工作：提示词维护、评测设计、异常处理、合规审查、支持工单、事件响应和用户培训。一个 token 成本看起来很低的流程，如果每十个输出就有一个需要升级处理，运营上可能很昂贵。可持续的 AI 经济性既包括算力成本，也包括人类监督成本。

第四个陷阱是智能体蔓延。智能体系统会因为规划、调用工具、检查结果、修订和再次尝试而放大成本。这对复杂任务可能有价值，但也可能制造不可见的循环。没有步骤预算、超时规则、任务边界和轨迹审查，智能体可能会花钱探索人类很快就会放弃的路径。自主性需要会计约束。

第五个陷阱是所有权薄弱。AI 支出常常夹在产品、工程、数据、安全和财务之间。如果没有人拥有从业务理由到模型路由再到结果衡量的完整链条，成本治理就会变成财务抱怨或工程清理任务。成功的团队会为每个 AI 流程指定负责人，并要求他们定义预期价值、可接受的每结果成本、质量阈值、回退路径和复盘节奏。

实际答案是把 AI 成本当作产品系统来管理，而不是当作水电账单。首先对流程分类：员工生产力、面向客户的自动化、决策支持、内容生成、工程辅助、监控和自主运营。每一类都需要不同的质量标准和风险控制。然后在流程层面衡量成本，而不只是模型层面。跟踪成功完成、升级处理、重试、延迟、用户采用、人类审查时间和业务影响。

团队也应该从一开始就为路由而设计。用较小模型处理常规分类、检索、格式化和草稿；用高级模型处理模糊性、高风险推理、综合分析和边缘情况。缓存重复上下文。修剪不必要的提示历史。把“知道了更好”的上下文与“决策关键”的证据分开。在错误代价高的地方加入人工检查点。更换供应商或模型版本之前先运行评测。

需要记住的关键点：

AI 成本由使用方式塑造 —— 上下文规模、重试、工具调用和智能体循环，可能比席位数量更重要。
仪表盘只是起点 —— 真正有用的指标是每个可靠业务结果的成本，而不只是 token 量。
最便宜不一定更省钱 —— 更低的模型费用可能带来更高的审查、重试、支持或错误成本。
智能体需要预算 —— 自主性应该配套步骤限制、可追踪性和明确停止规则。
所有权决定纪律 —— 每个 AI 流程都需要有人对价值、质量、风险和成本负责。

结论： 信号是，AI 成本可见性正在快速成熟，因为企业已经不能再把模型使用当作小规模实验支出。现实检验是，可见性本身不能解决单位经济问题。可持续的 AI 采用，将来自流程层面的所有权、智能路由、评测纪律、人类监督设计，以及对每个有用结果成本的清晰认识。

Read in English →