paddle ocr 750ti 3090 批量识别检测速度差不多负载也差不多
收藏
一个朋友写的 paddleocr webapi.exe的win10 本机gpu调用 我这边 单线程连续依次post 30张图片 进行测试 调用 nvidia-smi 进行监控显卡 发现一个奇怪的 现象 750ti 4g 、 tesla p4 8g、gtx960 4g 完成ocr时间 15秒左右 3090是10秒左右 在这个时间段内 前三种显卡gpu负载在30~40% 左右 3090 反而在 35~50% 按理来说3090算力这么高 应该不会负载这么高啊
750ti 4g 、 tesla p4 8g、gtx960 4g 用的是 2.6版 orc v3中文 cuda10版本
3090 用的是 2.6版 orc v3中文 cuda11版本
paddle ocr webapi win10测试的 tensorrt这个参数没有开启, 但是750ti 这种显卡居然和p4 1080ti 一个速度 3090也是从总顺序检测30张图 400×700分辨率左右时间 15秒降到了10秒 要知道 750ti fp32能力是 1400gflops 3090是35tflops 整整差了 25倍的速度
0
收藏
请登录后评论