Intercom 的豪赌:自研客服 AI 模型
15年历史的客服平台 Intercom 做出了一个不寻常的决定:自研 AI 模型。公司发布 Fin Apex 1.0,声称在客服指标上超越了 OpenAI 和 Anthropic 的领先模型。
性能数据
根据 Intercom 与 VentureBeat 分享的基准测试:
| 模型 | 解决率 |
|---|---|
| Fin Apex 1.0 | 73.1% |
| GPT-5.4 | 71.1% |
| Claude Opus 4.5 | 71.1% |
| Claude Sonnet 4.6 | 69.6% |
2% 的差距听起来不大,但对于大规模客服运营来说意义重大。
“如果你运营的是大规模客服中心,有 1000 万客户或 10 亿美元收入,2-3% 的差距代表着大量的客户互动和收入,”Intercom CEO Eoghan McCabe 表示。
其他指标
- 响应速度:3.7 秒,比次快对手快 0.6 秒
- 幻觉减少:相比 Claude Sonnet 4.6 减少 65%
- 成本:约为直接使用前沿模型的五分之一
基础模型之谜
Intercom 拒绝透露 Apex 基于哪个模型:
- 只确认参数规模在”数百亿”级别
- 承认使用开源权重模型作为基础
- 表示会随时间更换基础模型
“我们没有分享 Apex 1.0 使用的基础模型——出于竞争原因,也因为我们会随时间更换基础模型,”公司发言人说。
这种不透明性可能引发质疑,尤其是更多公司声称”自研”AI 实际上只是对开源模型进行后训练。
后训练:新前沿
McCabe 的核心论点是:基础模型已不再是差异化因素。
“预训练现在是一种商品,”McCabe 说,”真正的前沿在于后训练。后训练是难点。你需要专有数据,需要专有的真理来源。”
Intercom 使用多年来通过 Fin 积累的客服数据进行后训练:
- 超过 200 万每周对话
- 基于真实解决结果的强化学习
- 教授模型成功客服的特征:语气、判断、对话结构、识别真正解决
“通用模型在互联网通用数据上训练,专用模型在超特定领域数据上训练,”McCabe 解释,”因此通用模型的智能是通用的,专用模型的智能是领域特定的,在该领域表现更优。”
商业成功
Intercom 的 AI 转型正在奏效:
- Fin 接近 1 亿美元年度经常性收入
- 增长率 3.5 倍,是公司增长最快的业务
- 预计明年初将占公司总收入的一半
- 公司总 ARR 约 4 亿美元,预期今年增长 37%
三年前 Fin 发布时解决率只有 23%,现在平均 67%,部分企业部署高达 75%。
行业启示
Intercom 的举措提出了几个关键问题:
垂直 vs 通用 如果一家客服公司能构建超越前沿实验室的领域模型,那其他依赖通用 API 的厂商怎么办?
后训练能力 如果”后训练是新前沿”,企业需要构建自己的后训练能力,而非仅仅调用 API。
透明度压力 声称突破的公司会面临展示其工作的压力,还是继续以透明之名隐藏竞争细节?
未来展望
Intercom 计划将 Fin 扩展到销售和营销,直接与 Salesforce 的 Agentforce 愿景竞争。
McCabe 对 SaaS 行业的警告很明确:”如果你不能成为一家代理公司,你的 CRUD 应用业务前途黯淡。”
领域专用 AI 的时代可能正在到来——专业化的模型在特定任务上超越通用巨兽。
发表回复