关于ConvNeXt的一些想法
收藏
卷积神经网络发展了这么多年,其结构都是经过无数研究者之手雕琢出来的,比如多阶段设计思想
而 Swin 从 CNN 网络学习,把 ViT 搞成多阶段,不同阶段有不同分辨率,可以方便做下游,实际上这样的抄作业,不仅仅只有 Swin,PVT v1/v2、CoAtNet 等都体现了这个思想,你得承认现在很多 ViT 的改进方向都往 CNN 结合借鉴,抄抄经验更健康。但是CONVNET的结构是否也存在优化的可能呢?
0
收藏
请登录后评论
大家一起来讨论一下哦