Mmlu - 搜索 News

允中发自凹非寺量子位 | 公众号 QbitAI大模型刷榜 MMLU、屠榜 GPQA ...

SmolLM2 采用创新的四阶段训练策略，在仅使用 1.7B 参数的情况下，成功挑战了大型语言模型的性能边界：在 MMLU-Pro 等测试中超越 Qwen2.5-1.5B 近 6 个 ...

8 天

【新智元导读】 ...

来自MSN27 天

xAI工程师则表示，虽然Grok起步较晚，但在MMLU得分上以超快的速度追上了ChatGPT，Grok 3所涉及的训练是Grok 2的10倍，目前Grok 3已经在xAI内部运行了2周。

一些您可能无法访问的结果已被隐去。