# 通用目标检测 ## 1. 任务简介 目标检测任务是计算机视觉领域的核心问题,用于找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。PaddleX 通用目标检测方案,提供了不同量级的多个目标检测算法模型,能够满足用户不同任务、场景的需求。点击右上角 `创建模型产线` 选择配置好的 GPU、CPU 环境,可以快速体验效果。 <img src="https://github.com/PaddlePaddle/PaddleDetection/assets/12560511/e1fbfc70-2cd2-4e90-9aa0-82bbd8eb1af1" style="height: 400px"> ## 2. 模型选择和训练 首先根据任务的需要选择算法模型,然后输入预测图片,模型对输入图像进行处理分析,得到图像中全部目标的位置及其所属类别。 通用目标检测提供了 3 个算法模型,满足对性能和效率的不同需求,关于算法细节可以参考阅读:[RT-DETR](https://arxiv.org/abs/2304.08069)、[PP-YOLOE](https://arxiv.org/abs/2203.16250)、[PP-PicoDet](https://arxiv.org/abs/2111.00902)。 当通用任务无法满足特定场景时,推荐基于自有数据进行模型训练: | 场景方案 | mAP(%) | GPU 推理耗时(ms) | CPU 推理耗时(ms) | 模型存储大小(M) | 启动训练 | | ------- | ---- | --------- | ---------- | -----------| ------ | | rt_detr_hgnetv2_l | 53.0 | 12.34 | 228.53 | 125 | [训练](https://aistudio.baidu.com/aistudio/modelsdetail?modelId=273) | | ppyoloe_plus_l | 52.9 | 11.57 | 256.29 | 200 | [训练](https://aistudio.baidu.com/aistudio/modelsdetail?modelId=33) | | picodet_s_320_lcnet | 29.1 | 9.46 | 6.27 | 5 | [训练](https://aistudio.baidu.com/aistudio/modelsdetail?modelId=9) | **注:以上精度指标为 COCO2017 验证集 mAP(0.5:0.95),GPU 推理耗时基于 NVIDIA Tesla V100 机器,精度类型为 FP32, CPU 推理速度基于 Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz,线程数为 10,精度类型为 FP32。** ## 3. 模型部署 本模型目前的部署支持情况如下: | 操作系统 | Windows | Windows | Windows | Windows | Linux | Linux | Linux | Linux | | -------- | -------- | -------- | -------- | -------- | -------- | -------- | -------- | -------- | | 部署硬件 | NV GPU | NV GPU | X86 CPU | X86 CPU | NV GPU | NV GPU | X86 CPU | X86 CPU | | 接口语言 | C++ | Python | C++ | Python | C++ | Python | C++ | Python | | 支持情况 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | 根据实际业务需求选择所需要的操作系统、部署硬件、接口语言等条件后,获取 FastDeploy 部署包,**完成之后到开发者模式下进行下载(文件右击选择下载即可)**,其中包括部署代码和预测模型。 最后就可以参考部署包里面的 README 使用说明,在目标硬件上进行部署啦。 **注意:如果需要手动更新预测模型,可以直接修改部署包中的预测模型。**