R1 Model - 搜索 News

开场白Hello，大家好，国产之光大语言模型DeepSeek-R1，部署教程来了。本博主目前主要技术方向为AIGC应用，为了帮助提供基础服务的朋友快速部署DeepSeek-R1 ...

19 天

全球首次！2B复现DeepSeek-R1「啊哈时刻」，UCLA等用纯RL实现多模态推理

UCLA等机构的研究者发现，虽然目前已经涌现出许多试图复现DeepSeek-R1的研究，然而这些研究大多遭遇了这个难点：很难复现出R1所表现出的回答长度增加和思考模式。最初，研究者观察到了回答长度下降，因为基础模型倾向于生成HTML代码。通过强化学习，这种行为很快被抑制，随后回答长度开始规律地增加。之后，多模态的「啊哈时刻」出现了。随后，回答长度和基准准确率之间展现出一致的正相关关系。

13 天

阿里云发布QwQ-32B：仅用1/20参数比肩满血DS-R1

官方介绍，QwQ-32B 模型仅有 320 亿参数，然而其性能却能与拥有 6710 亿参数的满血版 DeepSeek R1 相媲美。尽管阿里云尚未发布完整的技术报告，但官方数据足以展现其强大实力。在编程竞赛（LiveCodeBench）和美国数学竞赛 ...

5 天on MSN

英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录

3 月 19 日消息，英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。据介绍，在搭载了八块 Blackwell GPU 的单个 ...

10 天

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

开源框架：我们基于 OpenRLHF 开发了一个高效可扩展的多模态大规模强化学习框架，支持 InternVL 等多种模型和 RL 算法。相比 R1-V 等已有框架，我们的方案成功训练了 InternVL 2.5-38B 等大型模型。稳定训练： ...

DoNews on MSN5 天

英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的纪录

DoNews3月19日消息，英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。据介绍，在搭载了八块 Blackwell GPU 的单个 ...

17 天

老显卡也能满血复活！美团首发INT8无损DeepSeek R1模型

在3月8日【妇女节】的特别日子里，美团为科技界带来一次精彩的发布会，宣布了对行业老显卡的一项重大利好——INT8无损满血版DeepSeek R1模型。该模型原生权重采用FP8格式，专为最新的NVIDIA GPU设计，但美团技术团队经过努力，成功实现了INT8精度量化，解锁了包括A100在内的老型号GPU的支持。

18 天

美团DeepSeek R1：INT8精度革新与50%吞吐提升揭秘

综合来看，DeepSeek R1作为美团在AI技术领域的重要成果，标志着深度学习模型在行业应用上的又一次突破。借助其INT8精度和50%吞吐提升，该模型为电商及相关业务的转型升级提供了强有力的技术支持。对于普通消费者和业内人士而言，保持对这项新技术的关注，参与相关讨论，将为更深刻理解智能推荐系统的未来提供机会。返回搜狐，查看更多 ...

10 天

出海应用也能享受高速稳定的DeepSeek-R1？亚马逊云科技出手了

随着生成式 AI 技术不断突破，企业和开发者对高性能、低延迟且稳定的云服务的需求也将愈发迫切。凭借全球领先的技术架构、丰富的模型资源和一流的安全保障，Amazon Bedrock 可以成为正大量涌现的 AI 应用的强大基石。

知乎专栏 on MSN3 天

老显卡福音！美团开源首发INT8无损满血版DeepSeek R1

美团搜推团队投稿量子位 | 公众号 QbitAI 满血版DeepSeek R1部署A100，基于INT8量化，相比BF16实现50%吞吐提升！美团搜推机器学习团队最新开源，实现对DeepSeek R1模型基本无损的INT8精度量化。要知道，DeepSeek ...

来自MSN1 个月

阿里云 PAI 支持云上部署 DeepSeek-V3、DeepSeek-R1 系列模型

在 Model Gallery 页面的模型列表中，单击找到并点击需要部署的模型卡片，例如“DeepSeek-R1-Distill-Qwen-7B”模型，进入模型详情页面。 3.

一些您可能无法访问的结果已被隐去。

显示无法访问的结果