然而在发布后,有媒体测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?” 遗憾的是,在不加任何定语以及 ...