AI 大模型 DeepSeek V3.2-Exp:稀疏注意力让 API 价格腰斩,每百万 token 仅 2.8 美分 DeepSeek V3.2-Exp 采用稀疏注意力架构,API 价格降至每百万输入 token 2.8 美分,长上下文推理成本大幅降低。 04/02 • wanyujun • 143 阅读 阅读全文 →
AI AI 工具 Cohere 开源语音识别模型词错误率仅 5.4%,达到生产可用标准 Cohere 开源 ASR 模型 Transcribe 词错误率仅 5.42%,超越 Whisper 和 ElevenLabs,支持 14 种语言,可在本地 G... 04/02 • wanyujun • 351 阅读 阅读全文 →
AI 大模型 Cohere 发布开源语音识别模型:5.4% 词错率超越 Whisper Cohere 推出开源权重 ASR 模型 Transcribe,词错率仅 5.42%,超越 Whisper Large v3 的 7.44% 和 ElevenL... 04/01 • wanyujun • 83 阅读 阅读全文 →
AI AI 工具 Mamba 3开源发布:语言建模效率提升4%,挑战Transformer霸主地位 Mamba架构的原班研发团队发布了第三代开源模型Mamba-3,这款采用Apache 2.0许可的语言模型在语 […] 03/22 • wanyujun • 469 阅读 阅读全文 →
AI 大模型 Nvidia 发布 Nemotron 3 系列:为 Agent AI 打造的开源模型 Nvidia 在 GTC 2026 发布 Nemotron 3 Ultra、Omni 和 VoiceChat 三款模型,专为 Agent AI 优化,支持多模态... 03/18 • wanyujun • 287 阅读 阅读全文 →