华为昇腾推出高性能保精度量化方案,更好适配DeepSeek
(文/万肇生 编辑/张广凯)
近日,华为公开了昇腾服务器上部署DeepSeek V3/R1推理的最佳实践,并介绍了一系列创新技术。
其中,华为在降低计算资源需求方面,创新提出了昇腾亲和的低比特量化解决方案OptiQuant,最终实现了INT8量化模式与FP8的模型推理精度持平。

由于DeepSeek V3/R1模型是基于英伟达生态训练,并推荐使用FP8精度推理,而国产芯片普遍没有原生支持FP8精度,导致国产芯片对DeepSeek的适配不佳。华为昇腾的上述研究应该就是为了解决这一问题。
通常情况下,在模型推理阶段,进行量化(如FP8量化为INT8)可以显著降低模型对硬件的存储需求和计算复杂度,但也会造成模型推理精度的损失以及逻辑错误等问题。因此如何保持推理精度,是低比特量化满足不同平台部署需求时的前提。
据华为介绍,基于BF16的DeepSeek需要1.3TB的显存空间,同时导致极大的算力和跨机通信开销。而校准集的泛化性缺失导致了在很多任务上难以达到与原有模型相近的精度水平,甚至在某些场景下精度下降十分严重。同时,还要考虑如何设计昇腾亲和的量化算法,以发挥硬件性能。
针对上述问题,华为提出了OptiQuant量化框架,一种高性能保精度量化方案,设计了层间自动混精、自动混合校准、离群值抑制、可学习的截断和SSZW参数量化算法。除了支持业界主流量化算法功能之外,它还新增支持三个功能:接入自定义量化算法和数值类型,可以将多种量化算法的自由组合搭配使用;支持业内主流评测数据集和用户自定义的数据校准集;支持数据并行和流水并行,针对不同大小的大语言模型实现精度验证性能加速。
OptiQuant框架主要由以下几个模块组成:
量化类型和数值类型:OptiQuant支持了Int2/4/8和FP8/HiFloat8等数据类型,支持业界的Qserve,HQQ,LUT等量化方法,在此基础上提出了可学习截断和量化参数优化等算法,进一步减少了量化误差。
多样化测试数据集和用户自定义校准集:多样化测试数据集和用户自定义校准集:OptiQuant支持了判断题,问答题,代码题和数学题等多种测试类别,语种上支持了十种常见语言。此外,OptiQuant支持用户自定义校准集,提升模型量化过程中的泛化性。
量化权重生成:OptiQuant提出了自适应层间混精算法,并且根据对应的量化配置生成对应的权重参数,通过去冗余技术减少参数保存的参数量;OptiQuant进一步提出了FlexSQ等算法,在数据校准过程中,对大模型激活异常值进行了平滑处理,有助于对激活做低比特量化。
最终,基于Atlas 800I A2服务器的精度测试实验结果显示,对于DeepSeek-V3-0324模型,W8A8C16和W4A8C16均采用Per-channel量化,实现了推理精度与FP8-GPU持平。


华为表示,在DeepSeek R1/V3大模型推理场景中,实现了INT8量化模式与FP8的模型推理精度持平,而且进一步发挥了华为Atlas 800I A2和CloudMatrix384集群推理硬件性能。而相关代码也将逐步开源。
本文系观察者网独家稿件,未经授权,不得转载。
相关内容:
-
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
大模型耗电惊人,舆论一浪高过一浪。现在,谷歌用硬核数据强势还击。一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。(文中数据均表示中位数)谷歌首席科学家Jeff Dean公开表示: 这个数值明显低于公众普遍预期的水平。并
2025-08-22 19:46:00 -
可灵AI计划进军游戏制作和专业影视制作
图片由AI生成8月21日晚,快手2025年二季度业绩电话会议上,快手科技创始人兼首席执行官程一笑表示,希望随着模型综合性能的提升,可灵AI逐步具备在游戏制作和专业影视制作等工业级场景的深度应用能力,拓展更多产业用户。目前可灵AI在这两个方向上已经有一定进展。在工业级场景的深度应用中,二季度,可灵AI
2025-08-21 21:38:00 -
国安机关提示:“旧手机换菜刀”可能有安全风险
“旧手机、旧电脑换菜刀、换不锈钢盆喽!”这与时俱进又略带夸张的吆喝,您是否也曾听过?一些闲置的“电子家当”留着无用,很多朋友会考虑出手置换,主打一个该省省该花花。那么,其中的风险隐患您又是否全然了解?不如和小安一起盘一盘,如何“变废为宝”又不“引火烧身”。安全处置 守护“数字身家”通讯录记录着社交网
2025-08-13 09:32:00 -
共建汽车行业可信数据空间,共促产业高质量发展
来源:【汽车纵横全媒体】当前,全球汽车产业正加速向数字化、智能化转型,深刻重塑着产业格局与发展路径。在这场变革中,数据已成为驱动汽车产业高质量发展的核心引擎。海量数据正以前所未有的速度和规模产生,并日益成为提升企业核心竞争力、推动产业转型升级的关键战略资源。随着国家关于数据要素市场化配置改革的持续推
2025-08-10 15:10:00 -
国家税务总局:县域经济销售收入占比升至24.3%
中新经纬7月28日电 28日,国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会。会上,国家税务总局局长胡静林表示,县域经济销售收入占全国比重由2020年的22.8%上升到今年上半年的24.3%,新型城镇化建设在加快。有媒体提问,“税收数据是经济社会发展的晴雨表,能否介绍一下税收数据
2025-07-28 11:49:00 -
辽宁唯一!鞍钢数科入选国家级企业可信数据空间创新发展试点
日前,国家数据局公布2025年可信数据空间创新发展试点项目名单,由市数据局(市营商环境建设局、市行政审批局)报送的鞍钢数智科技(辽宁)有限公司“钢铁企业产数双链融合可信数据空间”项目位列其中,成为我省唯一入选的试点项目,标志着鞍钢数科公司在推动数据要素安全可信流通、赋能产业升级方面获得国家级认可,成
2025-07-22 17:58:00