法国AI公司Mistral本周发布了Forge企业模型训练平台,让组织能够使用自有数据构建、定制和持续改进AI模型。这一举措将Mistral直接置于与超大规模云服务商竞争的位置,瞄准了企业AI市场中一个关键但较少被理解的领域。
超越微调API
Forge远远超出了Mistral及其竞争对手过去一年提供的微调API。该平台支持完整的模型训练生命周期:大规模内部数据集上的预训练、通过监督微调/DPO/ODPO进行的后训练,以及——至关重要地——强化学习流水线,用于将模型与内部策略、评估标准和运营目标持续对齐。
Mistral产品负责人Elisa Salamanca在接受VentureBeat专访时表示:”Forge是Mistral的模型训练平台。我们一直在幕后与AI科学家一起构建它。Forge带来的真正价值是让企业和政府能够根据特定需求定制AI模型。”
为什么微调API已经不够用?
过去两年,大多数企业AI采用遵循一个熟悉模式:从OpenAI、Anthropic、Google选择通用模型,然后通过云API进行微调。这种方法对概念验证和许多生产用例很有效,但当组织试图解决最困难的问题时就会遇到瓶颈。
“我们有一个基于监督微调的微调API。我想那是几个月前的标准做法,”Salamanca说,”它能让你达到概念验证状态。但当你真正想要达到目标性能时,你需要更进一步。今天的AI科学家不再使用微调API,他们使用更先进的工具,而这正是Forge带来的。”
Forge打包了Mistral内部AI科学家用于构建旗舰模型的训练方法论——包括数据混合策略、数据生成流水线、分布式计算优化和经过实战检验的训练配方。
真实案例:从古籍到手稿到量化语言
Salamanca分享了几个早期客户案例:
古籍修复:Mistral与一家公共机构合作,该机构拥有破损古籍中缺失文本的手稿。”现有模型无法完成这项工作,因为它们从未见过这些数据,”Salamanca解释道,”数字化效果不佳,存在独特的模式和字符。我们为它们创建了一个模型来填补空白,现在这被研究人员使用,加速了他们的出版和对这些文档的理解。”
代码迁移:与爱立信合作定制Codestral模型用于遗留代码到现代代码的翻译。爱立信积累了五年关于内部调用语言的专有知识——这种代码库如此专业化,没有现成模型见过它。成果是将原本需要一年的人工迁移过程(每位工程师需要六个月培训)转变为可扩展、更快的流程。
量化金融:与对冲基金合作定制模型用于专有量化语言——这些公司保存在本地、绝不暴露给云端AI服务的知识产权。使用Forge的强化学习功能,Mistral帮助一家对冲基金开发定制基准并训练模型超越它们,产生了”能够提供所需竞争优势的独特模型”。
与Nemotron联盟的协同
Forge的发布是Mistral本周一系列公告的一部分。公司还发布了Mistral Small 4模型、开源代码代理Leanstral,并作为联合开发者加入了英伟达新成立的Nemotron联盟。这些举措描绘了一家不再满足于模型基准竞争的公司形象,而是正在努力成为希望拥有而非租用AI的组织的设施骨干。
对于企业决策者,Forge提供了一个选择:与其依赖通用模型的微调,不如构建真正属于自己的AI能力。在AI竞争日益激烈的今天,专有模型和专有数据可能成为关键的差异化因素。
发表回复