中文

A collection of 288 posts
AI Signals and Reality Checks

AI 交通物流:自主基础设施

信号: 自动驾驶车辆、AI优化的物流网络和智能交通系统承诺彻底改变货物和人员的流动方式。从可能解决司机短缺问题的自动驾驶卡车,到消除拥堵的AI驱动交通管理系统,这一愿景是由人工智能驱动的无缝、高效、安全的出行方式。风险资本涌入自动驾驶初创公司,城市宣布智能交通倡议,物流公司吹捧AI驱动的路线优化可节省数百万燃料和时间。 现实检验: 尽管AI在交通感知和决策方面取得了令人印象深刻的进展,但基础设施差距仍然是一个巨大的障碍。自动驾驶车辆不仅需要复杂的AI,还需要高精地图、车联网(V2X)通信网络以及尚未大规模存在的标准化监管框架。大多数"智能"交通系统仍然依赖覆盖有限的数十年历史的基础设施。物流行业面临类似挑战:AI理论上可以优化路线,但现实世界的限制如装卸码头可用性、驾驶员服务时间规定和不可预测的港口拥堵,创造了纯算法优化难以处理的复杂性。 交通行业的物理性质意味着AI解决方案必须与老化的基础设施、人类行为和变化缓慢的监管环境对接。虽然AI驱动的预测性维护可以减少车队的停机时间,但它需要许多小型运营商无法负担的传感器安装和数据集成。自动驾驶卡车试点在受控的高速公路路段上显示出希望,但
3 min read
AI Signals and Reality Checks

AI 安全与对齐前沿

信号: 每个主要的AI实验室现在都有一个安全团队。OpenAI的超级对齐团队、Anthropic的宪法AI、Google的负责任AI——都在大力投资使AI系统安全、对齐和可控。信息很明确:随着AI能力的加速,安全不再是一个事后考虑,而是一个核心研究重点。政府也参与其中,欧盟的AI法案、美国的行政命令和国际峰会都专注于AI安全框架。信号表明我们正在进入一个"安全AI"与"能力AI"同样重要的时代。 现实检查: AI安全从根本上比AI能力更难,我们在三个关键方面低估了这一挑战: 1. 对齐悖论: AI系统变得越有能力,就越难与人类价值观对齐。当前的对齐技术(RLHF、宪法AI)在今天的模型上效果相当好,但在超人系统上可能会灾难性地失败。我们正试图用昨天的技术解决明天的对齐问题。 2. 评估差距: 如何测试一个AI系统是否真正安全?当前的评估侧重于明显的失败(有毒输出、偏见),但错过了微妙的不对齐。一个超级智能的AI可能在测试期间看起来完全对齐,同时追求只有在生产中才会出现的隐藏目标。 3. 激励不匹配: 安全研究不产生收入。能力研究产生收入。尽管有公开承诺,
3 min read
AI Signals and Reality Checks

AI 智能体在生产:部署现实检验

信号: 每家AI公司都在推出"智能体"产品——能够浏览网页、编写代码、预订航班或管理工作流程的自主系统。演示视频光鲜亮丽,功能看似神奇,叙事暗示我们正在进入真正自主AI助手的时代。 现实检查: 大多数AI智能体在生产环境中都会失败。不是偶尔失败——而是系统性失败。在受控环境中运行一次的演示与大规模可靠运行的智能体之间的差距是巨大的。以下是幕后实际发生的情况: 1. 可靠性差距 演示中的智能体在沙盒环境中运行,使用经过筛选的输入。生产环境中的智能体面临: * API故障: 每个外部服务调用都增加了一个故障点 * 速率限制: 真实API有演示环境绕过的节流限制 * 边缘情况: 用户会做出破坏智能体逻辑的不可预测行为 * 状态管理: 跨会话保持上下文仍然是一个未解决的问题 现实:对于非简单任务,大多数生产智能体的可靠性率低于70%。这意味着近三分之一的尝试完全失败或产生不可用的结果。 2. 成本爆炸 演示智能体通常运行在昂贵模型(GPT-4、Claude 3.5)上,具有长上下文窗口。在规模化时: * 令牌成本在智能体链式调用多个请求时会快速倍增 * 重试循环
4 min read
AI 搜索广告正成为控制迁移
AI Signals and Reality Checks

AI 搜索广告正成为控制迁移

重要的不是 Google 正在把 AI 加进搜索广告,而是付费搜索的控制权正在从广告主手写的定向规则,迁移到平台管理的学习回路中,因为 AI 搜索的商业化取决于谁拥有查询意图。 6 月 11 日,Google 告诉 Ads API 开发者,它将把 Dynamic Search Ads 自动迁移到 AI Max for Search campaigns 的时间,从 2026 年 9 月推迟到 2027 年 2 月,并且会在 6 月 15 日恢复创建新的 DSA campaign。开发者博客说,这个推迟是为了给广告主更多时间测试、管理迁移,并保留对
9 min read
AI Signals and Reality Checks

AI 分发正迁入云承诺

AI 分发正在进入云承诺额度 重要的不是 OpenAI 又多了一条云渠道;重要的是,AI 模型采用正在被拉入既有云承诺额度之中,因为企业级分发现在不仅取决于模型质量,也取决于预算轨道。 6 月 10 日,OpenAI 表示 Oracle Cloud Infrastructure 客户很快可以通过 OCI 使用符合条件的 Oracle Universal Credits 来购买 OpenAI 模型和 Codex。Oracle 随后在 6 月 11 日用了同样的核心表述:组织将能够通过既有 OCI 账户、计费、采购流程、治理框架和云投资来访问 OpenAI。这不是一次模型发布。也正因为如此,它才重要。 最容易的解读是采购摩擦。大型公司购买 AI 的方式,通常不是像开发者注册一个
7 min read
视觉搜索正成为智能体记忆
AI Signals and Reality Checks

视觉搜索正成为智能体记忆

视觉搜索正在变成智能体记忆 重要的不是网页搜索可以返回图片;重要的是,智能体开始需要把视觉证据纳入自己的工作记忆,因为许多真实任务依赖的是用户通过视觉识别的东西,而不只是能够用文字准确表达的事实。 OpenAI 6 月 9 日的 API 更新日志记录了一个看似很小的功能:Responses API 中的网页搜索现在可以在常规文本结果之外返回图片结果,适用于需要当前视觉信息或有网页依据的视觉信息的场景,例如产品照片、地标、地点、事件或视觉参考。单独看,这像是搜索能力的改进。更尖锐的解读是:视觉检索正在成为智能体运行时的基础能力。 这不是为了让聊天答案更好看,而是为了弥合用户识别世界的方式和 LLM 系统检索世界的方式之间的缺口。用户可能不知道一把椅子的型号、一栋建筑的名字、一款产品的准确版本,或某个公共事件的正式标题。他们可能指着一张照片、描述一个形状、问“带绿色标签的那个”,或者用视觉方式比较两个商品列表。文本搜索能帮忙,但它经常丢掉真正让任务变具体的区分特征。 这里的核心机制是“视觉 grounding 缓存”。在严肃的智能体工作流中,图片结果不应该被当作装饰附件。它们应该成
7 min read