AI AI 新闻 英伟达KVTC技术:大模型内存占用降低20倍,准确率损失不到1% 英伟达研究团队近日提出了一项突破性的大语言模型内存压缩技术KVTC(KV Cache Transform Co […] 03/21 • wanyujun • 231 阅读 阅读全文 →