AI Signals and Reality Checks

Google 正将智能体推入默认界面

Google I/O's sharper signal is not more Gemini features. It is the attempt to make agents inherit Search, Workspace, Android, shopping, and developer distribution by default.

Kaizhi Tang

20 May 2026 • 6 min read

The next agent battle is less about chat windows and more about where the agent is already allowed to act.

重要的事情并不是 Google 又发布了更多 AI 智能体。重要的是，Google 正在试图把智能体放进默认使用界面，因为真正会赢的智能体，很可能是在用户决定行动时，已经拥有上下文、权限和交易路径的那个。

这才是 Google I/O 2026 更尖锐的信号。5 月 19 日，Google 把这次大会包装成“agentic Gemini era”，发布了新模型、Search agents、Gemini Spark、Daily Brief、Antigravity 升级，以及 Gemini API 中的 Managed Agents。Google 的 I/O 公告汇总称，智能体正在被放进 Search、Gemini app、购物、开发者工具、Workspace、Android、YouTube 和新硬件形态中。真正的信号是这个覆盖面。

最容易的解读是，Google 正在用更大的产品包追赶 OpenAI 和 Anthropic。这有道理，但太浅。Google 是在把智能体行为放到用户本来就搜索、阅读、购物、安排日程、写作、写代码和携带身份的地方。如果这条路走通，关键比较就不是“Gemini app 对 ChatGPT app”，而是“独立智能体对继承默认分发面的嵌入式智能体”。

这里的具名机制是界面继承。普通聊天机器人必须说服用户把任务搬进聊天窗口。继承界面的智能体则从一个已有界面开始：Search、Gmail、Calendar、Docs、Android、Shopping、YouTube、AI Studio 或开发者平台。它从查询中继承意图，从连接应用中继承上下文，从账户中继承权限，并继承完成任务的路径。这并不自动意味着智能体足够好，但它改变了采用成本。

Google 的 Search 公告把这一点说得很清楚。用户将能够在 Search 中创建和管理多个智能体，首先是 information agents。这些智能体在后台运行，监测网页、新闻、社交帖子，以及金融、购物、体育等实时数据。Google 还描述了 agentic booking，以及在某些类别中由 Google 代表用户给商家打电话的能力。这不是一个更好的答案框，而是挂在 Search 上的监测与行动层。

Gemini app 的公告则指向同一方向。Daily Brief 会在后台跨连接应用工作，从 Gmail 和 Calendar 中提取信息，生成带有优先级下一步的晨间简报。Gemini Spark 是运行在 Gemini 3.5 和 Antigravity harness 上的 24/7 个人 AI 智能体，并整合 Workspace 工具。Google 想训练的用户行为不是“问一个问题”，而是“把一个持续责任委托给已经了解自己日常的界面”。

开发者侧的信号同样重要。Gemini API 中的 Managed Agents 可以启动一个智能体，让它推理、使用工具、在隔离的 Linux 环境中执行代码、浏览网页，并在保留状态的情况下恢复会话。Antigravity 2.0、CLI 与 SDK 选项、终端沙箱、凭证遮蔽、Android skills 和 Android Bench 都在扩展同一层。Google 正在尝试把智能体执行变成平台基础能力，而不只是一个代码界面。

容易被忽略的取舍是：界面继承通过集中权力来制造便利。独立聊天机器人上下文较弱，但边界也更清楚。嵌入式智能体可以读取邮箱、观察日历、监测购物需求、在 Search 中生成界面、联系服务商，并在设备关闭后继续工作。它有用，是因为它跨越多个界面；它有风险，也是因为这个原因。产品问题变成权限设计、撤销机制、任务范围、恢复和审计。

这会先改变用户行为，然后才改变组织架构。消费者可能不再把智能体看成一个要打开的 app，而是把它看成一种后台意图订阅：这个公寓出现时提醒我，汇总学校邮件，监测隐藏订阅费，为这场会议整理材料。开发者可能不再为每个工作流自建一套智能体栈，而是在托管基础设施、本地 harness 和嵌入式平台动作之间选择。运营者会问：这个智能体到底从哪里获得了行动权限？

第二阶后果是 AI 原生创业公司会承受更大的分发压力。创业公司仍然可以凭借更好的推理、用户体验、垂直工作流深度或信任取胜。但如果任务依赖 Gmail、Calendar、Search、Android、YouTube、购物库存、本地服务商或云部署，Google 可以让智能体感觉像已经在现场。创业公司必须一个连接器一个连接器地获取分发与权限。

当然，反方观点也成立。默认界面并不自动带来信任。如果后台智能体让用户感觉侵入、难以监督，或在关键行动时出错，用户会拒绝它。企业可能更偏好中立智能体层，而不是会加深锁定的平台自有智能体。开发者也可能发现，托管智能体很适合原型，但对需要自定义可观测性、路由、数据驻留或成本控制的生产系统限制太多。Google 还必须避免让 Search 从中立发现界面变成封闭行动漏斗。

下一步可证伪指标很明确：看用户是否创建持久智能体，而不是是否尝试演示。观察 Daily Brief、Search information agents、agentic booking 和 Gemini Spark 周期任务的留存。观察开发者是否在教程之外真正使用 Managed Agents，以及生产应用是否提供清晰的任务状态、权限、日志和交接控制。

对构建者来说，含义很具体。如果你在做智能体产品，不要把分发当成发布后的市场问题。先决定哪个界面能给智能体原生意图。决定用户在委托那一刻能理解哪些权限。要在智能体做有意义工作之前设计任务账本：它观察了什么，使用了什么，改变了什么，不能做什么，哪些地方需要人工批准。产品界面就是围绕后台行动的控制平面。

把 Google I/O 概括成“AI everywhere”很容易。但更有用的判断更窄：智能体正在被挂到意图本来就出现的地方。如果这件事变成常态，智能体市场就不会只由模型质量决定，而会由谁拥有“上下文变成行动”的界面决定。

现实校验：赢下市场的智能体，未必是聊天框里最聪明的那个。它可能是已经等在用户准备开始工作的界面里的那个。

Read in English →