Google 正将智能体推入默认界面
Google I/O's sharper signal is not more Gemini features. It is the attempt to make agents inherit Search, Workspace, Android, shopping, and developer distribution by default.
重要的事情并不是 Google 又发布了更多 AI 智能体。重要的是,Google 正在试图把智能体放进默认使用界面,因为真正会赢的智能体,很可能是在用户决定行动时,已经拥有上下文、权限和交易路径的那个。
这才是 Google I/O 2026 更尖锐的信号。5 月 19 日,Google 把这次大会包装成“agentic Gemini era”,发布了新模型、Search agents、Gemini Spark、Daily Brief、Antigravity 升级,以及 Gemini API 中的 Managed Agents。Google 的 I/O 公告汇总称,智能体正在被放进 Search、Gemini app、购物、开发者工具、Workspace、Android、YouTube 和新硬件形态中。真正的信号是这个覆盖面。
最容易的解读是,Google 正在用更大的产品包追赶 OpenAI 和 Anthropic。这有道理,但太浅。Google 是在把智能体行为放到用户本来就搜索、阅读、购物、安排日程、写作、写代码和携带身份的地方。如果这条路走通,关键比较就不是“Gemini app 对 ChatGPT app”,而是“独立智能体对继承默认分发面的嵌入式智能体”。
这里的具名机制是界面继承。普通聊天机器人必须说服用户把任务搬进聊天窗口。继承界面的智能体则从一个已有界面开始:Search、Gmail、Calendar、Docs、Android、Shopping、YouTube、AI Studio 或开发者平台。它从查询中继承意图,从连接应用中继承上下文,从账户中继承权限,并继承完成任务的路径。这并不自动意味着智能体足够好,但它改变了采用成本。
Google 的 Search 公告把这一点说得很清楚。用户将能够在 Search 中创建和管理多个智能体,首先是 information agents。这些智能体在后台运行,监测网页、新闻、社交帖子,以及金融、购物、体育等实时数据。Google 还描述了 agentic booking,以及在某些类别中由 Google 代表用户给商家打电话的能力。这不是一个更好的答案框,而是挂在 Search 上的监测与行动层。
Gemini app 的公告则指向同一方向。Daily Brief 会在后台跨连接应用工作,从 Gmail 和 Calendar 中提取信息,生成带有优先级下一步的晨间简报。Gemini Spark 是运行在 Gemini 3.5 和 Antigravity harness 上的 24/7 个人 AI 智能体,并整合 Workspace 工具。Google 想训练的用户行为不是“问一个问题”,而是“把一个持续责任委托给已经了解自己日常的界面”。
开发者侧的信号同样重要。Gemini API 中的 Managed Agents 可以启动一个智能体,让它推理、使用工具、在隔离的 Linux 环境中执行代码、浏览网页,并在保留状态的情况下恢复会话。Antigravity 2.0、CLI 与 SDK 选项、终端沙箱、凭证遮蔽、Android skills 和 Android Bench 都在扩展同一层。Google 正在尝试把智能体执行变成平台基础能力,而不只是一个代码界面。
容易被忽略的取舍是:界面继承通过集中权力来制造便利。独立聊天机器人上下文较弱,但边界也更清楚。嵌入式智能体可以读取邮箱、观察日历、监测购物需求、在 Search 中生成界面、联系服务商,并在设备关闭后继续工作。它有用,是因为它跨越多个界面;它有风险,也是因为这个原因。产品问题变成权限设计、撤销机制、任务范围、恢复和审计。
这会先改变用户行为,然后才改变组织架构。消费者可能不再把智能体看成一个要打开的 app,而是把它看成一种后台意图订阅:这个公寓出现时提醒我,汇总学校邮件,监测隐藏订阅费,为这场会议整理材料。开发者可能不再为每个工作流自建一套智能体栈,而是在托管基础设施、本地 harness 和嵌入式平台动作之间选择。运营者会问:这个智能体到底从哪里获得了行动权限?
第二阶后果是 AI 原生创业公司会承受更大的分发压力。创业公司仍然可以凭借更好的推理、用户体验、垂直工作流深度或信任取胜。但如果任务依赖 Gmail、Calendar、Search、Android、YouTube、购物库存、本地服务商或云部署,Google 可以让智能体感觉像已经在现场。创业公司必须一个连接器一个连接器地获取分发与权限。
当然,反方观点也成立。默认界面并不自动带来信任。如果后台智能体让用户感觉侵入、难以监督,或在关键行动时出错,用户会拒绝它。企业可能更偏好中立智能体层,而不是会加深锁定的平台自有智能体。开发者也可能发现,托管智能体很适合原型,但对需要自定义可观测性、路由、数据驻留或成本控制的生产系统限制太多。Google 还必须避免让 Search 从中立发现界面变成封闭行动漏斗。
下一步可证伪指标很明确:看用户是否创建持久智能体,而不是是否尝试演示。观察 Daily Brief、Search information agents、agentic booking 和 Gemini Spark 周期任务的留存。观察开发者是否在教程之外真正使用 Managed Agents,以及生产应用是否提供清晰的任务状态、权限、日志和交接控制。
对构建者来说,含义很具体。如果你在做智能体产品,不要把分发当成发布后的市场问题。先决定哪个界面能给智能体原生意图。决定用户在委托那一刻能理解哪些权限。要在智能体做有意义工作之前设计任务账本:它观察了什么,使用了什么,改变了什么,不能做什么,哪些地方需要人工批准。产品界面就是围绕后台行动的控制平面。
把 Google I/O 概括成“AI everywhere”很容易。但更有用的判断更窄:智能体正在被挂到意图本来就出现的地方。如果这件事变成常态,智能体市场就不会只由模型质量决定,而会由谁拥有“上下文变成行动”的界面决定。
现实校验:赢下市场的智能体,未必是聊天框里最聪明的那个。它可能是已经等在用户准备开始工作的界面里的那个。