首页 PaddleSlim 帖子详情
该怎么设置适合的量化配置? 已解决
收藏
快速回复
PaddleSlim 问答量化 412 1
该怎么设置适合的量化配置? 已解决
收藏
快速回复
PaddleSlim 问答量化 412 1

该怎么设置适合的量化配置?

旧鸱c_
已解决
2# 回复于2021-08
首先需要考虑量化模型上线的平台 平台 支持weight量化方式 支持activation量化方式 支持量化的OP ARM(Paddle-Lite) channel_wise_abs_max, abs_max moving_average_abs_max,range_abs_max conv2d, depthwise_conv2d, mul x86(MKL-DNN) abs_max moving_average_abs_max,range_abs_max conv2d, depthwise_conv2d, mul, matmul GPU(TensorRT) channel_wise_abs_max moving_average_abs_max,range_abs_max mul, conv2d, pool2d, depthwise_conv2d, elementwise_add, leaky_relu 部分层跳过量化 如果量化后精度损失较大,可以考虑跳过部分对量化敏感的计算不量化,比如最后一层或者attention计算。
展开
0
收藏
回复
全部评论(1)
时间顺序
旧鸱c_
#2 回复于2021-08

首先需要考虑量化模型上线的平台
平台
支持weight量化方式
支持activation量化方式
支持量化的OP
ARM(Paddle-Lite)
channel_wise_abs_max, abs_max
moving_average_abs_max,range_abs_max
conv2d, depthwise_conv2d, mul
x86(MKL-DNN)
abs_max
moving_average_abs_max,range_abs_max
conv2d, depthwise_conv2d, mul, matmul
GPU(TensorRT)
channel_wise_abs_max
moving_average_abs_max,range_abs_max
mul, conv2d, pool2d, depthwise_conv2d, elementwise_add, leaky_relu
部分层跳过量化

如果量化后精度损失较大,可以考虑跳过部分对量化敏感的计算不量化,比如最后一层或者attention计算。

0
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户