估值已达293亿美元的AI编程平台Cursor发布了其最新的自研模型Composer 2,这款基于中国开源模型Kimi K2.5微调的编程模型,在多项基准测试中超越了Claude Opus 4.6,同时将成本较前代产品降低了86%。这一发布标志着AI编程工具领域竞争进入新阶段。
大幅降价,性能提升
Composer 2提供了两个版本:
- Composer 2 Standard:输入$0.50/百万token,输出$2.50/百万token
- Composer 2 Fast:输入$1.50/百万token,输出$7.50/百万token
对比今年2月发布的Composer 1.5(输入$3.50/输出$17.50),新版本在价格上实现了约86%的降幅。Composer 2 Fast版本也比Composer 1.5便宜约57%。
为长程编程优化
Cursor强调,Composer 2的核心优势不在于单次代码生成的质量,而在于长程代理式编程能力。模型通过首次持续预训练获得了更强的基座,随后在长程编程任务上进行了强化学习训练,能够处理需要数百个操作步骤的复杂问题。
Composer 2拥有20万token的上下文窗口,针对工具使用、文件编辑和终端操作进行了深度优化,还引入了”自我总结”等技术来处理长时间运行的任务。
基准测试表现亮眼
Cursor公布的数据显示,Composer 2在多个基准测试中取得了显著进步:
- CursorBench:61.3分(前代44.2分)
- Terminal-Bench 2.0:61.7分(前代47.9分)
- SWE-bench Multilingual:73.7分(前代65.9分)
在Terminal-Bench 2.0测试中,GPT-5.4仍以75.1分领先,但Composer 2已超越Claude Opus 4.6(58.0分)和Opus 4.5(52.1分)。Cursor采取了务实的态度:不宣称全面领先,而是强调在性价比和产品整合方面的优势。
与Cursor深度整合
Composer 2的一个重要特点是其与Cursor平台的紧密整合。模型可以访问Cursor的完整代理工具栈,包括语义代码搜索、文件和文件夹搜索、文件读写、Shell命令、浏览器控制和网络访问。
然而,这种整合也意味着模型主要面向Cursor用户,而非通用的独立基础模型。对于已经在使用Cursor的开发团队,这种深度整合可能比原始模型质量更有价值。
应对第一方竞争压力
Cursor的发布背景值得关注。OpenAI和Anthropic不再只是提供模型,也在推出自己的编程界面和代理产品,如Codex和Claude Code。社交媒体上越来越多的用户讨论从Cursor转向Claude Code,特别是那些偏好终端优先工作流的高级用户。
通过推出更便宜的自研模型,并让快速版本成为默认体验,Cursor试图证明其整合平台和团队控制功能提供了足够的价值,值得开发者在第一方工具之外选择它。对于企业用户,Cursor提供从免费个人版到$200/月的Ultra版的多档订阅,企业版还提供团队功能、治理和审计控制。
Composer 2的发布表明,AI编程工具市场正在从单纯的模型竞争转向产品整合和性价比的较量。对于开发者而言,这意味着更多选择、更低成本,以及更快迭代的编程助手体验。
发表回复