首页 Paddle Inference 帖子详情
paddle ocr 750ti 3090 批量识别检测速度差不多负载也差不多
收藏
快速回复
Paddle Inference 问答推理高性能 559 0
paddle ocr 750ti 3090 批量识别检测速度差不多负载也差不多
收藏
快速回复
Paddle Inference 问答推理高性能 559 0

一个朋友写的 paddleocr webapi.exe的win10 本机gpu调用 我这边 单线程连续依次post 30张图片 进行测试 调用 nvidia-smi 进行监控显卡 发现一个奇怪的 现象 750ti 4g 、 tesla p4 8g、gtx960 4g 完成ocr时间 15秒左右 3090是10秒左右 在这个时间段内 前三种显卡gpu负载在30~40% 左右 3090 反而在 35~50% 按理来说3090算力这么高 应该不会负载这么高啊

750ti 4g 、 tesla p4 8g、gtx960 4g  用的是 2.6版 orc v3中文  cuda10版本

3090  用的是 2.6版 orc v3中文 cuda11版本

paddle ocr webapi win10测试的 tensorrt这个参数没有开启, 但是750ti 这种显卡居然和p4 1080ti 一个速度 3090也是从总顺序检测30张图 400×700分辨率左右时间 15秒降到了10秒 要知道 750ti fp32能力是 1400gflops 3090是35tflops 整整差了 25倍的速度

0
收藏
回复
需求/bug反馈?一键提issue告诉我们
发现bug?如果您知道修复办法,欢迎提pr直接参与建设飞桨~
在@后输入用户全名并按空格结束,可艾特全站任一用户