华为昇腾推出高性能保精度量化方案,更好适配DeepSeek
(文/万肇生 编辑/张广凯)
近日,华为公开了昇腾服务器上部署DeepSeek V3/R1推理的最佳实践,并介绍了一系列创新技术。
其中,华为在降低计算资源需求方面,创新提出了昇腾亲和的低比特量化解决方案OptiQuant,最终实现了INT8量化模式与FP8的模型推理精度持平。

由于DeepSeek V3/R1模型是基于英伟达生态训练,并推荐使用FP8精度推理,而国产芯片普遍没有原生支持FP8精度,导致国产芯片对DeepSeek的适配不佳。华为昇腾的上述研究应该就是为了解决这一问题。
通常情况下,在模型推理阶段,进行量化(如FP8量化为INT8)可以显著降低模型对硬件的存储需求和计算复杂度,但也会造成模型推理精度的损失以及逻辑错误等问题。因此如何保持推理精度,是低比特量化满足不同平台部署需求时的前提。
据华为介绍,基于BF16的DeepSeek需要1.3TB的显存空间,同时导致极大的算力和跨机通信开销。而校准集的泛化性缺失导致了在很多任务上难以达到与原有模型相近的精度水平,甚至在某些场景下精度下降十分严重。同时,还要考虑如何设计昇腾亲和的量化算法,以发挥硬件性能。
针对上述问题,华为提出了OptiQuant量化框架,一种高性能保精度量化方案,设计了层间自动混精、自动混合校准、离群值抑制、可学习的截断和SSZW参数量化算法。除了支持业界主流量化算法功能之外,它还新增支持三个功能:接入自定义量化算法和数值类型,可以将多种量化算法的自由组合搭配使用;支持业内主流评测数据集和用户自定义的数据校准集;支持数据并行和流水并行,针对不同大小的大语言模型实现精度验证性能加速。
OptiQuant框架主要由以下几个模块组成:
量化类型和数值类型:OptiQuant支持了Int2/4/8和FP8/HiFloat8等数据类型,支持业界的Qserve,HQQ,LUT等量化方法,在此基础上提出了可学习截断和量化参数优化等算法,进一步减少了量化误差。
多样化测试数据集和用户自定义校准集:多样化测试数据集和用户自定义校准集:OptiQuant支持了判断题,问答题,代码题和数学题等多种测试类别,语种上支持了十种常见语言。此外,OptiQuant支持用户自定义校准集,提升模型量化过程中的泛化性。
量化权重生成:OptiQuant提出了自适应层间混精算法,并且根据对应的量化配置生成对应的权重参数,通过去冗余技术减少参数保存的参数量;OptiQuant进一步提出了FlexSQ等算法,在数据校准过程中,对大模型激活异常值进行了平滑处理,有助于对激活做低比特量化。
最终,基于Atlas 800I A2服务器的精度测试实验结果显示,对于DeepSeek-V3-0324模型,W8A8C16和W4A8C16均采用Per-channel量化,实现了推理精度与FP8-GPU持平。


华为表示,在DeepSeek R1/V3大模型推理场景中,实现了INT8量化模式与FP8的模型推理精度持平,而且进一步发挥了华为Atlas 800I A2和CloudMatrix384集群推理硬件性能。而相关代码也将逐步开源。
本文系观察者网独家稿件,未经授权,不得转载。
相关内容:
-
华为昇腾推出高性能保精度量化方案,更好适配DeepSeek
(文/万肇生 编辑/张广凯) 近日,华为公开了昇腾服务器上部署DeepSeek V3/R1推理的最佳实践,并介绍了一系列创新技术。 其中,华为在降低计算资源需求方面,创新提出了昇腾亲和的低比特量化解决方案OptiQuant,最终实现了INT8量化模式与FP8的模型推理精度持平。 由于DeepSeek
2025-05-25 10:15:00 -
驾驭未来,科技筑梦!华朗学校举办全国青少年车辆模型教育竞赛
5月18日,众多车模运动爱好者关注和热捧的2025年“驾驭未来”全国青少年车辆模型教育竞赛深圳地区选拔赛在深圳市华朗学校举办。据介绍,“驾驭未来”全国青少年车辆模型教育竞赛是教育部白名单内的全国性青少年科技体育品牌活动,由国家体育总局和中国车辆模型运动协会主办。该赛事通过车辆模型这一载体,将科技、体
2025-05-20 17:25:00 -
扛不住了?iPhone 16系列价格崩盘,降幅超1400元,库克:压力倍增
5月10日,苹果向渠道商下发了调价通知,这也是苹果首次在周六宣布调价。苹果iPhone 16 Pro Max所有容量版本降价160美元,对应约1313.06元人民币;而iPhone 16 Pro的128GB版本降价176美元,对应约1445.27元人民币,其他版本同样降价160美元。目前iPhone
2025-05-11 15:35:00 -
从上海车展看汽车业转型“中国速度”
4月23日至5月2日,第二十一届上海国际汽车工业展览会(以下简称“上海车展”)在国家会展中心(上海)举行,来自26个国家和地区的近1000家中外企业携超百款新车及前沿技术亮相。本届上海车展期间,中国新能源车企在汽车产品定义、价格定义、商业模式上的大胆探索,产业链领军企业在研发效率、技术迭代、成本控制
2025-05-08 09:25:00 -
中国之声一线调研丨解困“表哥表姐” 重庆“一表通”智能报表改革为基层减负
央广网北京5月6日消息(总台记者谭瑱 赵聪聪)据中央广播电视总台中国之声报道,日报、周报、月报、年报……日常工作中,大家或多或少都与各类报表打过交道。这些统计报表是多层级部门间信息交互的重要载体,也能为相关部门制定政策、开展工作提供重要数据支撑。然而,记者调查发现,繁杂的数据采集、重复填报和多级审核
2025-05-06 22:33:00 -
【理通三迤】于锄头起落间体悟初心使命
作者:郭冬琼五一假期,陪母亲回家种植生姜,傍晚时分,已经累瘫的我躺在地里,看着天空思考着人生、价值、初心、使命等关键词,意识流在传统农耕与现代治理间反复跳跃,我脑中突然浮现百年前《觉醒年代》中的画面,李大钊同志在河北农村的麦田里攥着黄土说:“离泥土最近的政党,才能听见大地的呼吸。”新时代新征程,党员
2025-05-06 18:11:00