使用C++推理库进行GPU推理会降低模型运行显存么

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

丶丶泛滥的阳光发布于2021-09

python推理库和C++推理库进行GPUTensorRT推理时模型显存相差不大

0

收藏

回复

全部评论(3)

深渊上的坑

#2 回复于2021-09

相比训练时，好像预测的时候都不怎么关注显存

0

回复

李长安

#3 回复于2021-12

推理主要看模型大小和预测速度

0

回复

DeepGeGe

#4 回复于2021-12

预测阶段由于只需要进行前向计算，不需要保留后向传播计算的参数梯度等等，资源消耗会小的多。

0

回复

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~