3月6日凌晨,阿里云发布并开源全新的推理模型通义千问QwQ-32B。官方称,这个新模型仅仅拥有320亿参数,但在性能上比肩6710亿参数的满血版DeepSeek R1。
Qwen终于发力了。 从基准测试上来看,32B的QwQ-32B效果明显优于DeepSeek-R1-Distilled-Qwen-32B和DeepSeek-R1-Distilled-Llama-70B,可以接近DeepSeek-R1和o1-mini的水平。