Int8 - 搜索 News

根据 DeepSeek 最新发布的技术报告，V3/R1突破性的训练成本控制主要依托FP8精度训练方案。FP8是一种典型的模型量化技术，相较于业界常用的BF16精度，FP8精度通过将数据位宽减半显著降低了单次计算开销，但也会带来一定的精度损失。

11 天

美团开源INT8无损量化DeepSeek R1，A100性能提升50%，AI优化新标杆诞生

Deepseek问世以后，越来越多的人开始担心自己会不会被AI替代。但真正清醒的突围者早已发现，与其恐惧被AI替代，不如让AI成为生产力杠杆。

10 天

美团DeepSeek R1模型INT8量化版发布，老显卡也能畅享高效推理

近日，美团技术团队宣布了一项重大突破，成功将DeepSeek R1模型进行了INT8精度量化，这一技术升级不仅拓宽了模型的应用场景，也为广大开发者和企业带来了全新的可能性。在此之前，DeepSeek ...

11 天

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

据介绍，DeepSeek R1发布以后不少企业和个人都在尝试部署满血版本，但原生版本的模型权重为FP8数据格式，对GPU芯片类型有严格限制，仅能被英伟达新型GPU支持（如Ada、Hopper架构芯片），其他型号GPU（如A100）无法直接部署。

11 天

老显卡也能满血复活！美团首发INT8无损DeepSeek R1模型

在3月8日【妇女节】的特别日子里，美团为科技界带来一次精彩的发布会，宣布了对行业老显卡的一项重大利好——INT8无损满血版DeepSeek R1模型。该模型原生权重采用FP8格式，专为最新的NVIDIA GPU设计，但美团技术团队经过努力，成功实现了INT8精度量化，解锁了包括A100在内的老型号GPU的支持。

11 天

美团开源首发 INT8 无损满血版 DeepSeek R1，部署 A100 实现 50% 吞吐提升

IT之家 3 月 7 日消息，美团搜推机器学习团队 3 月 4 日公布最新首发开源成果，实现对 DeepSeek R1 模型基本无损的 INT8 精度量化。 DeepSeek R1 原生版本的模型权重为 FP8 数据格式，对 GPU 芯片类型有严格限制，仅能被英伟达新型 GPU 支持（如 Ada、Hopper 架构芯片），其他型号 GPU（如 A100）无法直接部署。目前， ...

11 天on MSN

美团开源INT8无损量化DeepSeek R1，A100性能提升50%

近期，美团搜推机器学习团队宣布了一项开源新进展，成功实现了对DeepSeek R1模型的无损INT8精度量化。这一成果在3月4日正式对外公布，标志着美团在深度学习模型优化方面取得了重要突破。据了解，DeepSeek ...

10 天

美团开源满血DeepSeek量化版？造福老显卡

美团技术团队近日宣布，对DeepSeek R1模型进行了INT8精度量化，使得该模型能够在老型号GPU如A100上进行部署。原生的DeepSeek ...

快科技11 天

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

快科技3月7日消息，日前美团技术团队宣布对DeepSeek R1进行了INT8精度量化，让DeepSeek R1可以在如A100等老型号GPU上进行部署。据介绍，DeepSeek R1发布 ...

11 天

美团开源首发INT8满血版DeepSeek R1!老显卡也能用

DeepSeek R1 原生版本的模型权重为 FP8 数据格式，对 GPU 芯片类型有严格限制，仅能被英伟达新型 GPU 支持（如 Ada、Hopper 架构芯片），其他型号 GPU（如 A100）无法直接部署。目前，量化代码已经合入到了开源 LLM 推理框架 SGLang，量化模型已经发布到了 Hugging Face 社区，方便用户使用。官方测试，满血版 DeepSeek R1 部署 ...

搜狐12 天

美团DeepSeek R1来袭：INT8精度量化让AI推理更高效

最近，该团队突破性地对DeepSeek R1进行了INT8精度量化实验，令人振奋的是，这一改进几乎没有损失原有的模型精度，成功实现了对A100及其他型号GPU的 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果