Anthropic本周发布了迄今为止最雄心勃勃的消费级AI代理功能——让Claude能够直接控制用户的Mac电脑。付费订阅用户现在可以让Claude代替他们点击按钮、打开应用、输入文字、导航软件,而用户则可以离开办公桌。
从对话助手到数字操作员
这一更新作为研究预览版向Claude Pro用户(每月17美元起)和Max用户(每月100或200美元)开放,目前仅支持macOS。功能集成在Claude Cowork生产力工具和Claude Code开发者命令行代理中。
Anthropic还扩展了上周推出的Dispatch功能——该功能允许用户从手机向Claude分配任务——现在也支持Claude Code。这意味着用户可以随时随地发出指令,回来时获得完成的交付成果。
分层优先级系统
电脑使用功能通过分层优先级系统工作。当用户给Claude分配任务时,它首先检查是否存在直接连接器——与Gmail、Google Drive、Slack、Google Calendar等服务的集成。这是最快、最可靠的路径。
如果没有连接器,Claude会通过Chrome浏览器扩展导航网页。只有在最后手段时,Claude才会直接与用户屏幕交互——像人类操作员一样点击、输入、滚动、打开应用。
这种层次结构很重要。正如Anthropic文档解释:”通过Slack连接拉取消息只需几秒钟,但通过屏幕导航Slack要慢得多,而且更容易出错。”屏幕级交互最灵活,但也是最慢、最脆弱的。
Dispatch:把手机变成远程控制器
真正的战略举措可能是Dispatch与电脑使用的结合。用户通过扫描二维码将移动设备与Mac配对,之后可以随时随地给Claude发短信指令。Claude在桌面端执行这些指令——Mac必须保持唤醒并运行Claude应用——然后返回结果。
Anthropic设想的使用场景包括:让Claude每天早上检查邮件、将每周指标拉入报告模板、整理杂乱的下载文件夹,或从本地文件和连接工具编译竞争分析报告。用户还可以设置定时任务——”每周五”、”每天早上”——让Claude自动处理,无需进一步提示。
早期测试:成功率约50%
Anthropic将其定位为研究预览是有原因的。早期实测显示,该功能在信息检索和摘要方面表现良好,但在更复杂的多步骤工作流中仍存在困难——尤其是需要跨多个应用交互的任务。
MacStories的详细评测显示:Claude成功定位特定截图、摘要Notion数据库中的最新笔记、添加URL到Notion、摘要最近收到的邮件、回忆会话中之前的截图。但未能打开Mac上的快捷指令应用、通过iMessage发送截图、列出Todoist未完成任务、显示Safari活动标签页中的食物订单等。
评测结论是:Dispatch”可以找到Mac上的信息,与连接器配合良好,但速度较慢,成功率大约50%。还不足以在你离开办公桌时依赖它,但这是朝着正确方向迈出的一步。”
隐私考量
当Claude与屏幕交互时,它会截取用户桌面截图来理解所见内容。这意味着Claude可以看到屏幕上的任何内容,包括个人数据、敏感文档或私人信息。
Anthropic表示已训练Claude避免股票交易、输入敏感数据或收集面部图像,但公司也坦诚”这些防护措施是Claude训练和指导的一部分,但并非绝对可靠。”用户需要谨慎考虑允许AI访问的权限范围。
行业竞争加剧
Anthropic的时机并非偶然。OpenAI、Google、Nvidia和众多初创公司都在追逐同样的目标——一个能在用户现有工具内部行动而不仅仅是旁边的AI。据报道,OpenAI正在积极争取私募股权公司,与Anthropic展开”企业争夺战”,而能够交付可工作的代理正成为决定性武器。
随着Claude电脑使用功能的推出,AI代理竞赛进入了新阶段。从对话到行动,从建议到执行,AI正在从辅助工具演变为真正的数字劳动力。
发表回复