允中 发自 凹非寺量子位 | 公众号 QbitAI大模型刷榜 MMLU、屠榜 GPQA ...
SmolLM2 采用创新的四阶段训练策略,在仅使用 1.7B 参数的情况下,成功挑战了大型语言模型的性能边界: 在 MMLU-Pro 等测试中超越 Qwen2.5-1.5B 近 6 个 ...
【新智元导读】 ...
xAI工程师则表示,虽然Grok起步较晚,但在MMLU得分上以超快的速度追上了ChatGPT,Grok 3所涉及的训练是Grok 2的10倍,目前Grok 3已经在xAI内部运行了2周。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果