Google 正将智能体推入默认界面

Google I/O's sharper signal is not more Gemini features. It is the attempt to make agents inherit Search, Workspace, Android, shopping, and developer distribution by default.

Editorial image of AI agents embedded across search, email, calendar, shopping, mobile, and developer tool surfaces, connected by permission and context paths.
The next agent battle is less about chat windows and more about where the agent is already allowed to act.

重要的事情并不是 Google 又发布了更多 AI 智能体。重要的是,Google 正在试图把智能体放进默认使用界面,因为真正会赢的智能体,很可能是在用户决定行动时,已经拥有上下文、权限和交易路径的那个。

这才是 Google I/O 2026 更尖锐的信号。5 月 19 日,Google 把这次大会包装成“agentic Gemini era”,发布了新模型、Search agents、Gemini Spark、Daily Brief、Antigravity 升级,以及 Gemini API 中的 Managed Agents。Google 的 I/O 公告汇总称,智能体正在被放进 Search、Gemini app、购物、开发者工具、Workspace、Android、YouTube 和新硬件形态中。真正的信号是这个覆盖面。

最容易的解读是,Google 正在用更大的产品包追赶 OpenAI 和 Anthropic。这有道理,但太浅。Google 是在把智能体行为放到用户本来就搜索、阅读、购物、安排日程、写作、写代码和携带身份的地方。如果这条路走通,关键比较就不是“Gemini app 对 ChatGPT app”,而是“独立智能体对继承默认分发面的嵌入式智能体”。

这里的具名机制是界面继承。普通聊天机器人必须说服用户把任务搬进聊天窗口。继承界面的智能体则从一个已有界面开始:Search、Gmail、Calendar、Docs、Android、Shopping、YouTube、AI Studio 或开发者平台。它从查询中继承意图,从连接应用中继承上下文,从账户中继承权限,并继承完成任务的路径。这并不自动意味着智能体足够好,但它改变了采用成本。

Google 的 Search 公告把这一点说得很清楚。用户将能够在 Search 中创建和管理多个智能体,首先是 information agents。这些智能体在后台运行,监测网页、新闻、社交帖子,以及金融、购物、体育等实时数据。Google 还描述了 agentic booking,以及在某些类别中由 Google 代表用户给商家打电话的能力。这不是一个更好的答案框,而是挂在 Search 上的监测与行动层。

Gemini app 的公告则指向同一方向。Daily Brief 会在后台跨连接应用工作,从 Gmail 和 Calendar 中提取信息,生成带有优先级下一步的晨间简报。Gemini Spark 是运行在 Gemini 3.5 和 Antigravity harness 上的 24/7 个人 AI 智能体,并整合 Workspace 工具。Google 想训练的用户行为不是“问一个问题”,而是“把一个持续责任委托给已经了解自己日常的界面”。

开发者侧的信号同样重要。Gemini API 中的 Managed Agents 可以启动一个智能体,让它推理、使用工具、在隔离的 Linux 环境中执行代码、浏览网页,并在保留状态的情况下恢复会话。Antigravity 2.0、CLI 与 SDK 选项、终端沙箱、凭证遮蔽、Android skills 和 Android Bench 都在扩展同一层。Google 正在尝试把智能体执行变成平台基础能力,而不只是一个代码界面。

容易被忽略的取舍是:界面继承通过集中权力来制造便利。独立聊天机器人上下文较弱,但边界也更清楚。嵌入式智能体可以读取邮箱、观察日历、监测购物需求、在 Search 中生成界面、联系服务商,并在设备关闭后继续工作。它有用,是因为它跨越多个界面;它有风险,也是因为这个原因。产品问题变成权限设计、撤销机制、任务范围、恢复和审计。

这会先改变用户行为,然后才改变组织架构。消费者可能不再把智能体看成一个要打开的 app,而是把它看成一种后台意图订阅:这个公寓出现时提醒我,汇总学校邮件,监测隐藏订阅费,为这场会议整理材料。开发者可能不再为每个工作流自建一套智能体栈,而是在托管基础设施、本地 harness 和嵌入式平台动作之间选择。运营者会问:这个智能体到底从哪里获得了行动权限?

第二阶后果是 AI 原生创业公司会承受更大的分发压力。创业公司仍然可以凭借更好的推理、用户体验、垂直工作流深度或信任取胜。但如果任务依赖 Gmail、Calendar、Search、Android、YouTube、购物库存、本地服务商或云部署,Google 可以让智能体感觉像已经在现场。创业公司必须一个连接器一个连接器地获取分发与权限。

当然,反方观点也成立。默认界面并不自动带来信任。如果后台智能体让用户感觉侵入、难以监督,或在关键行动时出错,用户会拒绝它。企业可能更偏好中立智能体层,而不是会加深锁定的平台自有智能体。开发者也可能发现,托管智能体很适合原型,但对需要自定义可观测性、路由、数据驻留或成本控制的生产系统限制太多。Google 还必须避免让 Search 从中立发现界面变成封闭行动漏斗。

下一步可证伪指标很明确:看用户是否创建持久智能体,而不是是否尝试演示。观察 Daily Brief、Search information agents、agentic booking 和 Gemini Spark 周期任务的留存。观察开发者是否在教程之外真正使用 Managed Agents,以及生产应用是否提供清晰的任务状态、权限、日志和交接控制。

对构建者来说,含义很具体。如果你在做智能体产品,不要把分发当成发布后的市场问题。先决定哪个界面能给智能体原生意图。决定用户在委托那一刻能理解哪些权限。要在智能体做有意义工作之前设计任务账本:它观察了什么,使用了什么,改变了什么,不能做什么,哪些地方需要人工批准。产品界面就是围绕后台行动的控制平面。

把 Google I/O 概括成“AI everywhere”很容易。但更有用的判断更窄:智能体正在被挂到意图本来就出现的地方。如果这件事变成常态,智能体市场就不会只由模型质量决定,而会由谁拥有“上下文变成行动”的界面决定。

现实校验:赢下市场的智能体,未必是聊天框里最聪明的那个。它可能是已经等在用户准备开始工作的界面里的那个。


Read in English →