阿里团队刚刚传来消息:他们用于AI大模型训练的芯片全部采用国产,且性能几乎与英伟达H800持平。如此出色的性能,想必价格不菲? 然而事实却是,采用全系列国产芯片后,每单位算力的成本反而降低了20%。
报道认为,这凸显了中国公司试图使用本地芯片来替代最先进的英伟达半导体。蚂蚁集团本月份发布了一份研究报告,称其模型在部分基准测试中超过了 Meta,如果按预期工作,蚂蚁的平台可能为中国 AI 发展迈出又一个新的步伐。
知情人士称,蚂蚁集团使用了包括来自 阿里巴巴和华为的芯片 ,采用所谓的“专家混合机器学习”方法来训练模型,测试结果取得了与采用 英伟达H800 等芯片训练相似的结果。
具体来说,蚂蚁集团借助阿里巴巴、华为等国内厂商的AI/GPGPU芯片,采用五种不同的硬件配置,完成了高达9万亿token的预训练,最终所需的训练成本从635万元降至508万元。通过这种创新的动态参数分配、混合精度调度和自适应容错恢复策略,蚂蚁团队将高效训练的可能性扩大到了更加低端的计算设备上。
从产品背景来看,蚂蚁集团自成立以来投入巨资于人工智能技术的研发,始终致力于在金融、医疗等领域应用前沿科技。目前,蚂蚁集团在全球金融科技领域具有举足轻重的地位,尤其是在移动支付和数字金融技术上,其市场份额和品牌影响力毋庸置疑。根据2024年市场调查数据,蚂蚁集团在数字金融领域的市场占有率接近30%,在推动国内AI技术应用方面的投入也越来越受到业界关注。
近期有知情人士对外媒透露,大陆蚂蚁集团正使用中国本土制造的半导体来开发AI模型训练技术,这将使成本降低20%。而且令人意外的是,这种来自阿里巴巴与华方的晶片採用专家混合(Mixture of Experts,MoE)机器学习方 ...
使用CUDA 12.6,在H800 SXM5上,其性能指标是: 3000 GB/s内存带宽(内存限制性能),支持快速数据访问和传输。 580 TFLOPS计算性能(计算约束性能),为 ...
快科技3月24日消息,近日,据媒体报道,有知情人士透露,蚂蚁集团正使用中国制造的半导体来开发AI模型训练技术,这将使成本降低20%。
白交 发自 凹非寺量子位 | 公众号 QbitAI DeepSeek开源周第一天,降本大法公开—— FlashMLA,直接突破H800计算上限。 网友:这怎么可能?? 它是为Hopper ...
知情人士称,蚂蚁集团使用包括阿里巴巴和华为在内的中国国产芯片,并通过混合专家机器学习方法训练模型。蚂蚁集团称,当中得到的结果与美国晶片巨头英伟达H800等芯片的结果相似。其中一名知情人士说,蚂蚁集团仍在使用英伟达芯片进行AI开发,但现在其最新模型主要依赖包括超威半导体和中国芯片在内的替代品。
知情人士称,蚂蚁集团使用了包括来自阿里巴巴和华为的芯片,采用所谓的“专家混合机器学习”方法来训练模型,测试结果取得了与采用英伟达H800等芯片训练相似的结果。 据公开资料显示,”英伟达H800”是英伟达研发的芯片,专为高性能计算和人工智能训练设计的高端GPU芯片,广泛应用于数据中心和AI模型训练场景。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果