飞桨论文复现3D-ResNets
收藏
《Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition》
——百度老师带领解读
具有时空三维核的卷积神经网络(3D CNNs)能够直接从视频中提取时空特征进行动作识别。虽然由于3D内核的参数太多,但是利用最近巨大的视频数据库,3D cnn得到了极大的改进,且3D神经网络的架构相对较浅。文中作者提出了一个基于ResNets的3D CNNs以更好的动作表示,百度老师从相关介绍、论文方法、结果展示以及代码解读详细、直观地带我们领读了文章,讲解非常清晰,不仅对文章中的理论知识、方法论和优缺点进行了详细讲解,还对代码进行了简要分析,重点指出文章中的许多内容需结合代码才能更加清晰的理解,这点很关键。老师讲解的部分内容如下:
完整课件内容请参考课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1340
0
收藏
请登录后评论
消灭零回复
顶
顶顶顶
+1
赞!
赞!resnet 用于视频分类
赞!