图像多目标检测
收藏
看了口罩识别,有一个想法,对于某些场景,比如场景在 厨房,识别 厨师们 的 口罩 帽子 围裙 再加个护膝(厨师用不着这个,但我想加难度)。对于数据标注是3个,有为1 无为0.
这种场景是切图比较好,还是直接将图片传给算法,让算法自己去识别比较好呢?我这里切图的意思是指,使用人体关键点模型,将身体分割成3部分,分别将头部,上半身,下半身。分别去训练一个网络,头部 帽子 口罩 识别。上半身围裙识别,下半身 护膝识别
lfq1324564
已解决
6#
回复于2022-09
不用做了,已经想通了,现在的飞桨gan模块,OCR等模块基本上用的都是这类套路。比如paddleocr,说是训练好的模型仅8兆。其实呢,事先借用了分割算法,提前把数字隔出来了,然后再用自己的OCR算法去识别,那模型肯定大大减小了。我最近想玩玩paddleGan,结果根本跑不通,dlib这个包不兼容Python3.7,好多人都卡在这里了。我查了一下,dlib这个包可实现人脸检测。 那么,这也算反证法吧,我想得应该没错。将大问题切成小问题,会加速模型收敛。
0
收藏
请登录后评论
大佬去试试啊
大佬做出来了嘛?
你才是大佬,天天榜上有名,我还想请教你呢?
不用做了,已经想通了,现在的飞桨gan模块,OCR等模块基本上用的都是这类套路。比如paddleocr,说是训练好的模型仅8兆。其实呢,事先借用了分割算法,提前把数字隔出来了,然后再用自己的OCR算法去识别,那模型肯定大大减小了。我最近想玩玩paddleGan,结果根本跑不通,dlib这个包不兼容Python3.7,好多人都卡在这里了。我查了一下,dlib这个包可实现人脸检测。
那么,这也算反证法吧,我想得应该没错。将大问题切成小问题,会加速模型收敛。
不用做了,已经想通了,现在的飞桨gan模块,OCR等模块基本上用的都是这类套路。比如paddleocr,说是训练好的模型仅8兆。其实呢,事先借用了分割算法,提前把数字隔出来了,然后再用自己的OCR算法去识别,那模型肯定大大减小了。我最近想玩玩paddleGan,结果根本跑不通,dlib这个包不兼容Python3.7,好多人都卡在这里了。我查了一下,dlib这个包可实现人脸检测。
那么,这也算反证法吧,我想得应该没错。将大问题切成小问题,会加速模型收敛。
学到了