GPU H200 - 搜索 News

掀桌子了！满血版3万Tokens每秒，英伟达捅破DeepSeek推理性能天花板 ...

随着NVIDIA平台持续探索Blackwell Ultra GPU和Blackwell GPU架构的极限潜力，这些推理性能的天花板会不断被捅破。图1. 在NVL8配置下运行TensorRT-LLM软件的NVIDIA B200 ...

20 小时

DigitalOcean 借 Flexential 亚特兰大数据中心，部署英伟达 H200

据香港IDC新天域互联了解，云服务企业 DigitalOcean 与 Flexential 达成合作协议，将在 Flexential 的亚特兰大 - 道格拉斯维尔数据中心开展高密度 GPU 部署，旨在为不断攀升的人工智能（AI）及机器学习（ML）工作负载提供有力支撑。

腾讯网8 天

独家对话GMI Cloud：从“训练”卷到“推理”，AI企业如何突破算力 ...

图片来源：元宝近年来，全球AI产业经历了一场从“模型军备竞赛”到“应用落地厮杀”的范式转移。当ChatGPT掀起的大模型浪潮褪去，行业逐渐意识到：训练出千亿参数的模型只是起点，如何让AI在真实交互场景中高效推理、创造价值，才是未来发展的关键。2025 ...

1 天

AMD MI300X引领AI计算新纪元，性能超越H200

在人工智能技术不断发展的今天，AMD近日发布的MI300X显然成为行业的焦点。这款采用最新架构的GPU在运行DeepSeek-R1模型时，其表现引发了广泛关注——其性能在相同延迟条件下吞吐量最高可达到英伟达H200的五倍。在并发处理能力上，MI300X甚至可以在Token间延迟不超过50毫秒的情况下，支持128个并发请求，而H200仅能支持16个，这彻底打破了以往计算能力的极限。

7 天on MSN

英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录

3 月 19 日消息，英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。据介绍，在搭载了八块 Blackwell GPU 的单个 ...

1 天

AMD跑DeepSeek性能超H200！128并发Token间延迟不超50ms，吞吐量达H200五倍

在稍早一些的测试当中，使用SGLang在MI300X上运行DeepSeek-R1，仅过了两周就相比于day 0时性能提升到了4倍，吞吐量达到了每秒5921 Tokens。 [1] https://rocm.blogs.amd.com/artificial-intelligence/DeepSeekR1-Part2/README.html ...

来自MSN4 个月

英伟达发布新AI硬件：H200 NVL PCIe GPU 和 GB200 NVL4 超级芯片

此外 h200 nvl pcie gpu 支持双路或四路的 900gb/s 每 gpu 的 nvlink 桥接器互联。英伟达表示 h200 nvl 内存容量是此前 h100 nvl 的 1.5 倍，带宽也达 1.2 倍，拥有 ...

8 天

超微电脑扩大GPU服务器产品线以支持AI工作负载

将NVIDIA Blackwell系列GPU整合到超微电脑的服务器中，预计将提升LLM推理、AI、可视化、图形渲染和虚拟化工作负载的性能。公司的GPU优化系统已通过NVIDIA认证，确保与NVIDIA AI Enterprise软件的兼容性。根据 InvestingPro 数据，超微电脑目前的市盈率为15.68，相对于其增长潜力来说具有吸引力，在快速发展的AI基础设施市场中占据有利位置。

来自MSN6 个月

由英伟达H200 GPU提供支持的Amazon EC2 P5e实例正式可用

Amazon EC2 P5e实例提供8个英伟达H200 GPU，具有1128GB高带宽GPU内存，同时提供第三代AMD EPYC处理器，2TB系统内存和30TB本地NVMe存储。Amazon EC2 P5e实例还提供 ...

中时新闻网7 天

《电周边》GTC大会和硕端最新高密度GPU机柜解决方案

和硕（4938）在今年GTC隆重宣布其最新高密度GPU机柜解决方案，该产品基于NVIDIA GB300 NVL72平台。AI伺服器搭载NVIDIA HGXTM B300 NVL16及NVIDIA MGX伺服器配载NVIDIA RTX PROTM 6000 Blackwell Server Edition GPU ...

快科技22 天

中国公司悄悄拿到不少Blackwell GPU：8颗要价440万元！

另外，老一代的H100 GPU也依然能买到，而且便宜得多，8颗大约为25万美元，折合人民币约180万元。不久前，甚至有人公开晒出他到手的H200八卡服务器 ...

6 天

想一想英伟达的AI高性能GPU几万美元一

想一想英伟达的AI高性能GPU几万美元一个，3-5年后会到几千人民币一个吗？一旦如此，今天英伟达的股价估值该如何？用市盈率、市梦率还是基于十年期国债收益率？ H100：这是英伟达专为人工智能打造的高性能GPU，目前出厂价约为3.5万美元左右，折合人民币约为25万元。一个大模型就不得不用几万块，太可怕了。 H200：也是一款性能强劲的GPU，有消息称其单卡价格也较为高昂。例如市场上曾有8颗英伟达H2 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果