识别效果如下
这个是分享效果,可以互相交流
这样子。
因为这个背景很简单,白底黑字,只用做二值化处理就可以实现捕捉,当然背景情况比较复杂可能就不行了,当然我这个没有做那么复杂,毕竟判断多了帧率就很低了
opencv怎么知道该捕捉谁呢
opencv有专门的库可以直接找到所有的外接框
行的,我过些天整理一下,然后发到我的github上,谢谢关注哦
最大外接框你是用什么做的?手动标出来吗,还是有什么VOC
主要思想就是:
1.将图片做阈值化处理,将数字的变得更加突出,但是这也可能导致数字部分轮廓断裂,所以做这一步的之前最好还是先做腐蚀操作。
2.取数字的最大外接框,找到每个数字的坐标,然后截取框内数字读取模型跑一次前向传播,预测数字是几。
具体问题欢迎大家一起探讨,这个做的识别还有缺陷。
就一个识别效果?不来点干货?
这个是分享效果,可以互相交流
这样子。
因为这个背景很简单,白底黑字,只用做二值化处理就可以实现捕捉,当然背景情况比较复杂可能就不行了,当然我这个没有做那么复杂,毕竟判断多了帧率就很低了
opencv怎么知道该捕捉谁呢
opencv有专门的库可以直接找到所有的外接框
行的,我过些天整理一下,然后发到我的github上,谢谢关注哦
最大外接框你是用什么做的?手动标出来吗,还是有什么VOC
主要思想就是:
1.将图片做阈值化处理,将数字的变得更加突出,但是这也可能导致数字部分轮廓断裂,所以做这一步的之前最好还是先做腐蚀操作。
2.取数字的最大外接框,找到每个数字的坐标,然后截取框内数字读取模型跑一次前向传播,预测数字是几。
具体问题欢迎大家一起探讨,这个做的识别还有缺陷。
就一个识别效果?不来点干货?