Intercom 的豪赌:自研客服 AI 模型

15年历史的客服平台 Intercom 做出了一个不寻常的决定:自研 AI 模型。公司发布 Fin Apex 1.0,声称在客服指标上超越了 OpenAI 和 Anthropic 的领先模型。

性能数据

根据 Intercom 与 VentureBeat 分享的基准测试:

模型解决率
Fin Apex 1.073.1%
GPT-5.471.1%
Claude Opus 4.571.1%
Claude Sonnet 4.669.6%

2% 的差距听起来不大,但对于大规模客服运营来说意义重大。

“如果你运营的是大规模客服中心,有 1000 万客户或 10 亿美元收入,2-3% 的差距代表着大量的客户互动和收入,”Intercom CEO Eoghan McCabe 表示。

其他指标

  • 响应速度:3.7 秒,比次快对手快 0.6 秒
  • 幻觉减少:相比 Claude Sonnet 4.6 减少 65%
  • 成本:约为直接使用前沿模型的五分之一

基础模型之谜

Intercom 拒绝透露 Apex 基于哪个模型:

  • 只确认参数规模在”数百亿”级别
  • 承认使用开源权重模型作为基础
  • 表示会随时间更换基础模型

“我们没有分享 Apex 1.0 使用的基础模型——出于竞争原因,也因为我们会随时间更换基础模型,”公司发言人说。

这种不透明性可能引发质疑,尤其是更多公司声称”自研”AI 实际上只是对开源模型进行后训练。

后训练:新前沿

McCabe 的核心论点是:基础模型已不再是差异化因素。

“预训练现在是一种商品,”McCabe 说,”真正的前沿在于后训练。后训练是难点。你需要专有数据,需要专有的真理来源。”

Intercom 使用多年来通过 Fin 积累的客服数据进行后训练:

  • 超过 200 万每周对话
  • 基于真实解决结果的强化学习
  • 教授模型成功客服的特征:语气、判断、对话结构、识别真正解决

“通用模型在互联网通用数据上训练,专用模型在超特定领域数据上训练,”McCabe 解释,”因此通用模型的智能是通用的,专用模型的智能是领域特定的,在该领域表现更优。”

商业成功

Intercom 的 AI 转型正在奏效:

  • Fin 接近 1 亿美元年度经常性收入
  • 增长率 3.5 倍,是公司增长最快的业务
  • 预计明年初将占公司总收入的一半
  • 公司总 ARR 约 4 亿美元,预期今年增长 37%

三年前 Fin 发布时解决率只有 23%,现在平均 67%,部分企业部署高达 75%。

行业启示

Intercom 的举措提出了几个关键问题:

垂直 vs 通用 如果一家客服公司能构建超越前沿实验室的领域模型,那其他依赖通用 API 的厂商怎么办?

后训练能力 如果”后训练是新前沿”,企业需要构建自己的后训练能力,而非仅仅调用 API。

透明度压力 声称突破的公司会面临展示其工作的压力,还是继续以透明之名隐藏竞争细节?

未来展望

Intercom 计划将 Fin 扩展到销售和营销,直接与 Salesforce 的 Agentforce 愿景竞争。

McCabe 对 SaaS 行业的警告很明确:”如果你不能成为一家代理公司,你的 CRUD 应用业务前途黯淡。”

领域专用 AI 的时代可能正在到来——专业化的模型在特定任务上超越通用巨兽。