当前,拥有完整自主可控的 AI 技术栈已成为国家战略性需求。DeepSeek、QwQ 等优秀的国产开源大模型正在重塑全球科技产业格局,但在大模型推理部署领域,业界仍高度依赖国外开源工具。
天翼云GPU裸金属搭配主流H800、A800、L40S GPU等加速卡的裸金属实例,支持最大3.2T RDMA高速网络,结合天翼云高性能文件存储HPFS,为用户在模型训练 ...
据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,实现 DeepSeek 推理成本降低一半、性能翻番。其定位为“生产级大模型推理引擎”,提供如下特性: ...
IT之家 3 月 14 日消息,清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎“赤兔 Chitu”现已开源。据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,实现 DeepSeek ...
沐曦MetaX最新的MXC500曦云系列产品采用通用GPU架构,兼容CUDA,目标FP32算力15TFLOPS(英伟达A100的FP32性能为19.5TFLOPS),号称对标英伟达A100/A800。
该公司最新的 MXC500 曦云系列产品号称对标英伟达 A100 / A800,目标 FP32 算力 15 TFLOPS(英伟达 A100 的 FP32 性能为 19.5 TFLOPS),采用通用 GPU 架构 ...
该公司最新的 MXC500 曦云系列产品号称对标英伟达 A100 / A800,目标 FP32 算力 15 TFLOPS(英伟达 A100 的 FP32 性能为 19.5 TFLOPS),采用通用 GPU 架构,兼容 CUDA。
华为发布下一代数据存储产品OceanSor A800。华为数据存储产品线总裁周跃峰表示,当前大多数的数据中心GPU集群利用率低于50%,这意味着生成式AI需要 ...
IT之家 12 月 17 日消息,由 TechPowerUp 开发的显卡信息与监控应用程序 GPU-Z 时隔 4 个月迎来 ... Ti ES、H100 80GB HBM3、A4000H、A800 40 GB Active、RTX 5880 Ada ...