谷歌正在 AI 代理浏览器大战中加码。公司宣布一系列将 Gemini 深度嵌入 Chrome 的新功能,首先是在美国向 Mac 和 Windows 用户推出 Chrome 版 Gemini,不再需要会员费用。

代理功能即将到来

像 OpenAI 的 ChatGPT Agent 一样,谷歌也计划在未来几个月引入让 Chrome 版 Gemini 能够代表用户执行「繁琐任务」的能力。Chrome 产品管理总监 Charmaine D’Silva 在媒体简报会上表示,这设计用于根据邮件中的购物清单进行购物、重新安排配送、预约理发、预订餐厅等,对于任何被视为「高风险」或「不可逆」的操作都将设置检查点。

跨标签页和多产品集成

新功能包括让 Chrome 版 Gemini 访问 Google Workspace(针对普通和企业用户),并启用与 Google Calendar、YouTube、Maps 等其他 Google 产品的集成。这些变化允许 Gemini「找到屏幕上的相关信息并在屏幕上采取行动」。

在桌面版 Chrome 上,用户现在可以在多个不同标签页中使用 Gemini AI 代理来比较产品、从多个来源总结信息,并从用户的浏览器历史记录中回忆之前的页面。这意味着从今天开始,用户可以关闭那些无数的标签页,然后让 AI 代理回忆它们。

「假设你在看团队建设活动,一天结束时——如果你想第二天继续,通常人们会保持这些标签页打开,」D’Silva 说。「但现在你可以关闭这些标签页,第二天早上去说,’嘿,能给我看我昨天看的那些团队建设活动吗?’我们会自动显示。」

移动端改进

在移动端,Gemini 已经集成到 Android 中,但用户现在可以分享整个页面的上下文,而不仅仅是当前屏幕上的内容,这样他们可以问「更深入的问题」。iPhone 用户将很快能够通过 Chrome 应用访问 Gemini。

激烈的浏览器竞争

AI 代理在用户浏览器中工作的改进已经持续了一段时间。去年,Anthropic 推出 Computer Use,允许 Claude 作为 AI 代理使用你的浏览器并代表你完成任务。几个月后,OpenAI 宣布 Operator,设计用于做同样的事情。今年 7 月,OpenAI 将其 Deep research 和 Operator 功能合并为一个代理工具 ChatGPT Agent。同月,Perplexity 推出了自己的 AI 驱动浏览器 Comet。Atlassian 刚刚花费 6.1 亿美元收购浏览器公司 Arc 的制造商 Dia。

这是 OpenAI、Anthropic、Google、Perplexity 和其他公司都在争夺消费者 AI 驱动浏览器使用权的战斗的一部分。随着代理能力的扩展,浏览器正在成为 AI 公司最重要的战场之一。