在固定策略生成的计算量下 (2048×2×600 次推理调用),BFS-Prover 实现了 70.83% 的准确率,超过所有现有系统,包括使用价值函数的 InternLM2.5-StepProver (65.9 ...