这样的进展使得Grok家族在短短一年内达到OpenAI GPT模型六年来的发展水准。 根据官方数据,Grok 3及其轻量版Grok 3 mini在数学(AIME 2025)、科学(GPQA)、程式设计(LCB Oct0Feb)等标竿测试中,均取得优于Google Gemini 2 Pro、DeepSeek V3、GPT-4o及Claude 3.5 Sonnet的成绩。