ECO论文复现记-百度顶会论文复现营（飞桨）

首页版块访问AI主站注册发帖

hujx 发布于2020-08 浏览:4598 回复:1

ECO论文复现记-百度顶会论文复现营（飞桨）

快速回复

百度复现营课程：https://aistudio.baidu.com/aistudio/education/group/info/1340

论文笔记：https://zhuanlan.zhihu.com/p/168318224

https://zhuanlan.zhihu.com/p/208805217

论文：https://arxiv.org/pdf/1804.09066.pdf

代码：https://github.com/mzolfaghari/ECO-pytorch

一、复现方式
尽可能移植pytorch代码到Paddle的方式，上手快，需要读懂原来的代码。原论文代码从TSN pytorch移植过来，有关代码解读可参阅如下两篇文章，写的很详细。ECO pytorch代码与TSN代码基本一致。

1.TSN算法的PyTorch代码解读（训练部分）

TSN算法的PyTorch代码解读（训练部分）_AI之路-CSDN博客blog.csdn.net

2.TSN算法的PyTorch代码解读（测试部分）

https://blog.csdn.net/u014380165/article/details/79058381?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param

二、主要步骤
百度复现营的老师论文复现的步骤和要点讲解的非常详细，手把手教如何复现论文。

下面重点说一说移植过程中遇到的一些坑。

1.超参数

论文中提到的主要超参数：The initial learning rate is 0.001 and decreases by a factor of 10 when validation error saturates for 4 epochs. We train the network with a momentum of 0.9, a weight decay of 0.0005, and mini-batches of size 32。

原代码移植到AI Studio平台时，Batch size一般用16，设置太大了，GPU内存溢出。

2.数据处理

图像处理部分需要对原代码使用torch.vision.Transformer的相关内容进行改写，paddle2.0中也有类似的版本。pytorch与paddle的dataset,dataloader的用法不一样，需要按照paddle的方式改写。

3.模型搭建

原代码采用yaml文件描述模型，采用动态方式搭建网络和前向计算。两个框架的算子和数据格式有差异，这个地方核对模型的结构和数据格式，直到模型的输入、输出和正向计算都正确无误。

pytorch的预训练模型可以通过代码转换到paddle来使用，需要注意模型和数据对齐。遇到的一个坑是pytorh转换到paddle的模型，在windows里没法加载，只能在linux下用。

4.优化器定义

pytorch原代码的优化器定义、调整和梯度裁剪分成了三部分，在paddle中可以在定义时就把动态调整的方式确定了，相对来说比较方便。

5.训练和测试过程

原代码训练过程中用了模型重载的train()方法，在Paddle代码中需要修改过来，不然会出现训练一轮、测试一轮就报错。

6.对齐

网络对齐、数据对齐和精度对齐是最花时间的地方，也是坑最多的地方。两个框架都有类似的方法处理数据，但输入和输出是大多不一致，需要仔细对照文档进行调试。

热门活动

文档

图像主体检测

个赞

共1条回复最后由188******76回复于2020-09

#2188******76回复于2020-09

赞！

快速回复

小编推荐

三分钟识别所有小动物！

金天皇上 77回复

邀测 | 红酒识别技术申请试用抢先体验

用户已被禁言 23回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服