性能表现 单个DGX系统配备8个B200 GPU,可实现每秒超过250个token的处理速度,最大吞吐量达到每秒超过30000个token。 性能预览 Vera ...