谷歌近日发布了其自主研究代理的重大升级版本——Deep Research和Deep Research Max两款全新AI代理,首次实现了通过单一API调用将开放互联网数据与企业私有数据相融合的能力,并能在研究报告中直接生成原生图表和信息图。
基于Gemini 3.1 Pro的突破性升级
此次发布建立在谷歌的Gemini 3.1 Pro模型之上,标志着AI系统自主进行多源深度研究竞赛进入了一个关键转折点。这类研究传统上需要人类分析师花费数小时甚至数天才能完成。谷歌CEO桑达尔·皮查伊在社交媒体上表示:“我们在Gemini API中为Deep Research推出了两个强大更新,现在拥有更好的质量、MCP支持以及原生图表/信息图生成能力。”
Deep Research标准版针对低延迟、交互式使用场景进行了优化,适合需要将研究能力直接嵌入用户界面的应用场景。而Deep Research Max则采用扩展的测试时计算技术——模型在交付最终报告前会花费更多计算周期进行迭代推理、搜索和输出优化,专为异步后台工作流设计。
MCP支持:打通企业私有数据的桥梁
此次更新中最引人注目的功能莫过于对模型上下文协议(MCP)的支持。这一新兴开放标准使Deep Research能够安全地查询私有数据库、内部文档仓库和专业第三方数据服务,且敏感信息无需离开原始环境。
谷歌透露,正在与FactSet、S&P和PitchBook等金融数据提供商积极合作开发MCP服务器设计。这意味着对冲基金可以同时将Deep Research指向内部交易流数据库和金融数据终端,然后要求代理综合分析两者以及来自网络的公开信息。
开发者现在可以同时使用Google搜索、远程MCP服务器、URL上下文、代码执行和文件搜索来运行Deep Research——也可以完全关闭网络访问,仅在自定义数据上进行搜索。该系统还接受多模态输入,包括PDF、CSV、图像、音频和视频作为基础上下文。
原生图表生成:从研究工具到分析产品的蜕变
另一项重磅功能是原生图表和信息图生成能力。此前版本的Deep Research只能生成纯文本报告,需要可视化数据的用户必须自行导出数据并构建图表。新代理可以在报告中内联生成高质量图表和信息图,以HTML格式渲染,将复杂数据集动态可视化为分析叙述的一部分。
一位AI评论者在社交媒体上指出:“代理在报告中内联生成HTML图表和信息图。不是截图,不是建议你’可视化这些数据’。是实际渲染在Markdown输出中的图表。”这对于金融和咨询行业需要交付可直接面向利益相关者的分析产品的用户来说,意义重大。
从消费级功能到企业级平台基础设施
此次发布清晰地勾勒出谷歌数月来一直在构建的战略叙事:Deep Research不仅仅是一个消费级功能,而是驱动多个谷歌产品的基础设施组件,如今正作为平台向外部开发者开放。谷歌在官方博文中明确指出,使用Deep Research代理API的开发者实际上接入的是“驱动Gemini应用、NotebookLM、Google搜索和Google Finance等谷歌最受欢迎产品中研究能力的同一套自主研究基础设施”。
这两款代理现已通过Gemini API的付费层级以公开预览版形式提供,可通过谷歌于2025年12月首次推出的交互API访问。这一发布无疑将加剧谷歌与OpenAI、Anthropic等竞争对手在企业AI研究领域的角逐。
发表回复