飞桨EasyDL图像分类：AI自动识别车辆类型

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

杨杨蕊1002 发布于2022-07

项目说明
业务背景
随着城市化进程的不断推进，中国汽车的保有量一直保持上升态势，截止至2022年3月底，全国汽车保有量达3.07亿，汽车保有量的不断上升。不同车辆类型的分类在智能交通系统、公共安全等领域扮演着重要角色，例如高速收费口的车辆类型识别、停车场收费口的车辆类型识别、日常交通监控中的车辆类型识别等。

业务难点
以收费口管理场景为例，依据不同的车辆类型具有不同的收费标准，依靠人工判断并计算费用效率低且具有个人主观意识。

解决思路
为提高识别效率，避免主观因素影响收费标准，企业决定通过AI训练车辆类型识别的模型，与收费标准结合形成自动化的计费收费流程。鉴于市场上的车辆外观、类型也在不断的更新迭代，依靠通用解决方案很难满足实际应用需求，因此，企业选用飞桨EasyDL提供的零门槛AI开发功能，企业不需要了解算法基础即可快速完成模型训练，结合车辆类型识别的业务场景，企业选用了EasyDL-图像分类进行模型开发，并最终集成到业务产线中应用。

提示：在车辆类别识别的场景中，仅需辨别单张图片中的车辆属于某个类型即可，因此选用图像分类解决业务问题。

数据准备
当您数据采集时，需要注意保证单个图片中仅有一个目标主体车辆，避免造成识别困扰。您数据采集的角度需要和实际应用时的摄像头角度保持一致。

提示：考虑到收费口存在不同天气、天黑等情况，在数据采集时各种情况的数据均需要采集，例如，傍晚、黑夜、下雪等。

在发起任务训练前应采集训练所需的场景数据，选用收费系统历史积累的图片数据用于模型训练，训练数据应尽可能与实际业务场景中的数据保持一致。数据准备完成后，不同类别的图片数据按照文件夹分别存储，可直接将图片数据及标注信息导入到平台中。在平台上点击【导入】选择【有标注信息】【以文件夹命名分类】导入到平台中，文件夹标签即为分类名，每个子文件夹下的图片即为当前标签下的图片数据。

模型训练
数据准备完成后，可创建模型训练所需的选择图像分类任务类型，点击创建模型，根据您的业务实际内容自定义命名模型名称完成模型创建。考虑到车辆类型分类模型应用在收费口时，对预测性能要求较高，车辆的识别效率将直接影响到通勤效率，因此该选择本地部署方案-通用小型设备-高精度算法。该方案的优势是：本地部署方式可有效节省预测数据上传及预测结果下发所需的时间，大幅提高预测效率，选择通用小型设备作为部署硬件可在边缘计算设备上获得更佳的预测表现，高精度算法可一定程度上提高模型的精度，如下图：

模型部署
模型训练完成后，如您对模型效果满意，可将模型打包为离线SDK，EasyDL平台提供了广泛的硬件适配，可结合业务场景选择具体的硬件类型及操作系统。

模型发布完成后，可在【纯离线服务】中找到已发布的模型SDK，下载并【获取序列号】激活即可部署在终端应用中。

企业将AI模型应用到实际场景中以实现停车费用、过路费用的自动计算，在收费口中由相机对每个车辆进行拍摄，拍摄到的图片传输到预测设备上进行类型识别，基于识别出来的车辆类型自动进行费用计算。基于该智能智能方案，停车场及道路收费效率提高80%，大幅提升资源利用率。

效果优化
车辆类型识别在高速收费路口的应用中，场景相对单一且拍摄角度一致，因此首次训练模型效果优异，准确率达到了95%，鉴于市面上的车辆类型不断更新迭代且部分车辆的主要特征也不断发生变化，因此可在模型投入应用后，持续收集模型实际运行过中产生的数据，定期添加数据进行模型迭代，保证模型效果。

常见问题
问题1：EasyDL图像提供了多种训练任务，在该场景下为什么要选择图像分类任务类型？

目前EasyDL图像提供了图像分类、物体检测、图像分割三种任务类型：图像分类适用于图片中主体或者状态单一的场景；物体检测适用于多个主体且需要识别主体位置的场景；图像分割可定位到多个主体且需要定位到主体像素级的位置。针对汽车分类场景，主要目标是识别单张图片上的车辆具体属于哪个类别，对位置定位等无要求，因此选用图像分类较为合适。

问题2：目前我的数据中不同标签的数据数量不平衡，多的标签可能达到几百张，但是少的标签数据只有几十张，这样会不会影响训练效果，有没有解决办法？

EasyDL平台针对图像分类任务提供数据不平衡优化功能，可有效提高数据不平衡场景下的模型效果。该功能可在发起训练时选选择对应的开关打开即可。