法国AI公司Mistral本周发布了企业级模型训练平台Forge,允许组织使用自有数据构建、定制和持续改进AI模型。此举使Mistral直接与亚马逊、微软和谷歌等云巨头在企业定制模型市场展开竞争。
超越简单的微调
Forge平台的定位远超传统的微调API。它支持完整的模型训练生命周期:大规模内部数据预训练、监督微调、DPO/ODPO后训练,以及用于模型对齐的强化学习管道。
Mistral产品负责人Elisa Salamanca在专访中表示:「传统的微调API只能带您到达概念验证阶段。当您需要真正的目标性能时,必须走得更远。今天的AI科学家不会使用微调API,他们使用更先进的工具,这就是Forge提供的。」
保护敏感数据
Forge的一大卖点是数据隐私。当客户在自有基础设施上进行训练时,Mistral完全不会接触到训练数据。这与必须将数据上传到云端的黑箱模式形成鲜明对比。
这一特性对国防、情报、金融和医疗等行业至关重要。Mistral已与ASML、新加坡DSO国家实验室、欧洲航天局等组织建立合作,瞄准最注重数据安全的企业市场。
真实案例:从古籍修复到金融量化
Salamanca分享了几个典型用例:
某公共机构拥有残损古籍数字化文档,现有模型从未见过这些独特字符。Mistral为其定制了专门修复缺失文本的模型。
爱立信与Mistral合作,为专有内部编程语言定制Codestral模型,将年度人工迁移流程转化为可扩展的自动化方案。
对冲基金使用Forge的强化学习功能,为专有量化语言开发定制基准和模型,获得竞争优势。
嵌入式AI科学家
Forge的商业模式包含一个独特元素:前线部署科学家。这些AI研究人员嵌入客户团队,协助设计训练配方、优化数据管道。这一模式与Palantir早期策略相似——强大的软件加上专业人员服务。
该平台可在Mistral集群、Mistral Compute或客户自有数据中心运行。对于在自己集群运行的客户,Mistral不收取计算费用,而是对Forge平台收取许可费,以及可选的数据管道服务和嵌入式科学家费用。
挑战云巨头
Salamanca指出,云厂商的训练工具存在两个根本限制:一是纯云端无法满足本地部署需求;二是提供的简化API接口无法满足深度模型训练需求。
此外,使用闭源模型的企业面临着模型更新导致生产流程崩溃的风险。Forge让企业真正拥有自己的AI能力,而非向美国云厂商租赁。
发表回复