paddle ocr 750ti 3090 批量识别检测速度差不多负载也差不多

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

y yoyangkim 发布于2023-08

一个朋友写的 paddleocr webapi.exe的win10 本机gpu调用我这边单线程连续依次post 30张图片进行测试调用 nvidia-smi 进行监控显卡发现一个奇怪的现象 750ti 4g 、 tesla p4 8g、gtx960 4g 完成ocr时间 15秒左右 3090是10秒左右在这个时间段内前三种显卡gpu负载在30~40% 左右 3090 反而在 35~50% 按理来说3090算力这么高应该不会负载这么高啊

750ti 4g 、 tesla p4 8g、gtx960 4g 用的是 2.6版 orc v3中文 cuda10版本

3090 用的是 2.6版 orc v3中文 cuda11版本

paddle ocr webapi win10测试的 tensorrt这个参数没有开启，但是750ti 这种显卡居然和p4 1080ti 一个速度 3090也是从总顺序检测30张图 400×700分辨率左右时间 15秒降到了10秒要知道 750ti fp32能力是 1400gflops 3090是35tflops 整整差了 25倍的速度

0

收藏

回复

提issue

需求/bug反馈？一键提issue告诉我们

提pr

发现bug？如果您知道修复办法，欢迎提pr直接参与建设飞桨~