(北京11日讯)据中国媒体援引消息人士说法,DeepSeek下一代AI模型DeepSeek-R2将提前于下周一(3月17日)发布。 据称,DeepSeek-R2在多个关键领域实现突破,包括更出色的程式设计能力、多语言推理能力,以及以更低的成本提供更高的准确性。消息人士认为,这些特性若得以兑现,可能使其在全球AI竞赛中占据显着优势。
最好还有一个高性价比的R2-Lite(不是R2-mini ... 2024年5月,在DeepSeekMoE架构上推出DeepSeek-V2, 是236B的MoE架构模型,并首次提出MLA来加速KV Cache。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果