Mistral AI推出Forge平台：帮助企业构建专有大模型

法国AI公司Mistral本周发布了Forge企业模型训练平台，让组织能够使用自有数据构建、定制和持续改进AI模型。这一举措将Mistral直接置于与超大规模云服务商竞争的位置，瞄准了企业AI市场中一个关键但较少被理解的领域。

超越微调API

Forge远远超出了Mistral及其竞争对手过去一年提供的微调API。该平台支持完整的模型训练生命周期：大规模内部数据集上的预训练、通过监督微调/DPO/ODPO进行的后训练，以及——至关重要地——强化学习流水线，用于将模型与内部策略、评估标准和运营目标持续对齐。

Mistral产品负责人Elisa Salamanca在接受VentureBeat专访时表示：”Forge是Mistral的模型训练平台。我们一直在幕后与AI科学家一起构建它。Forge带来的真正价值是让企业和政府能够根据特定需求定制AI模型。”

为什么微调API已经不够用？

过去两年，大多数企业AI采用遵循一个熟悉模式：从OpenAI、Anthropic、Google选择通用模型，然后通过云API进行微调。这种方法对概念验证和许多生产用例很有效，但当组织试图解决最困难的问题时就会遇到瓶颈。

“我们有一个基于监督微调的微调API。我想那是几个月前的标准做法，”Salamanca说，”它能让你达到概念验证状态。但当你真正想要达到目标性能时，你需要更进一步。今天的AI科学家不再使用微调API，他们使用更先进的工具，而这正是Forge带来的。”

Forge打包了Mistral内部AI科学家用于构建旗舰模型的训练方法论——包括数据混合策略、数据生成流水线、分布式计算优化和经过实战检验的训练配方。

真实案例：从古籍到手稿到量化语言

Salamanca分享了几个早期客户案例：

古籍修复：Mistral与一家公共机构合作，该机构拥有破损古籍中缺失文本的手稿。”现有模型无法完成这项工作，因为它们从未见过这些数据，”Salamanca解释道，”数字化效果不佳，存在独特的模式和字符。我们为它们创建了一个模型来填补空白，现在这被研究人员使用，加速了他们的出版和对这些文档的理解。”

代码迁移：与爱立信合作定制Codestral模型用于遗留代码到现代代码的翻译。爱立信积累了五年关于内部调用语言的专有知识——这种代码库如此专业化，没有现成模型见过它。成果是将原本需要一年的人工迁移过程（每位工程师需要六个月培训）转变为可扩展、更快的流程。

量化金融：与对冲基金合作定制模型用于专有量化语言——这些公司保存在本地、绝不暴露给云端AI服务的知识产权。使用Forge的强化学习功能，Mistral帮助一家对冲基金开发定制基准并训练模型超越它们，产生了”能够提供所需竞争优势的独特模型”。

与Nemotron联盟的协同

Forge的发布是Mistral本周一系列公告的一部分。公司还发布了Mistral Small 4模型、开源代码代理Leanstral，并作为联合开发者加入了英伟达新成立的Nemotron联盟。这些举措描绘了一家不再满足于模型基准竞争的公司形象，而是正在努力成为希望拥有而非租用AI的组织的设施骨干。

对于企业决策者，Forge提供了一个选择：与其依赖通用模型的微调，不如构建真正属于自己的AI能力。在AI竞争日益激烈的今天，专有模型和专有数据可能成为关键的差异化因素。

Mistral AI推出Forge平台：帮助企业构建专有大模型

超越微调API

为什么微调API已经不够用？

真实案例：从古籍到手稿到量化语言

与Nemotron联盟的协同

发表回复取消回复

最新文章

文章分类

Mistral AI推出Forge平台：帮助企业构建专有大模型

超越微调API

为什么微调API已经不够用？

真实案例：从古籍到手稿到量化语言

与Nemotron联盟的协同

发表回复 取消回复

最新文章

文章分类

发表回复取消回复