首页 飞桨菁英计划 帖子详情
实习日志
收藏
快速回复
飞桨菁英计划 文章实习就业 355 2
实习日志
收藏
快速回复
飞桨菁英计划 文章实习就业 355 2

转眼间,十四天的飞桨菁英计划已经接近尾声,总的来说,这半个月的时光对我来说是收获满满的。

严格来说,本次实习其实更像是一次论文复现比赛,但对于我们组来说,可能完全没有这种紧张的感觉。在个人赛阶段,由于我们组都没花费太多精力去完成题目,导致在最初选题的时候我们组只有可怜的2分,在一开始就处于一个被动的境地,选题也随便选了两篇,在上手之后才发现困难重重,在刚开始努力了几天,深刻明白了选择比努力更重要的道理之后,我们组就开始处于一个很“佛”的状态。但对我来说,这种很“佛”状态下关于技术的交流却令我受益匪浅。

我们组选的前两篇文章是GHM和PANet,最初我主要负责GHM的部分,由于mmdetection框架的存在,对齐部分很困难,由于我还有另外一个比赛要做,最开始的几天经常debug到晚上很晚,而由于不住在附近,早上7点就要起床,确实有些疲惫。但经历了几天高强度的coding之后,我对于paddle的整体框架和api等有了一个基本的了解,paddle确实存在一些不完善的地方,比如对切片等操作支持不足,与numpy反复转换容易显存爆炸等,但paddle整合的一些很方便的包确实对于深度学习的推广与本土化有很大的帮助,我也坚信百度要做一个本土框架的想法是绝对正确的。

之后几天,随着第二批文章下发,我开始了对一篇GAN领域文章的复现,相对于之前的GHM和PANet来说,这篇文章简单了许多,整个改API和对齐部分并未遇到太大的问题,但由于之前确实没接触过GAN的领域,我确实低估了图像生成训练的难度,开始正常训练的网络却在几万轮后loss变为NAN,查看官方代码发现issue里也存在这个问题,所以可能就是文章本身所存在的不足。在尝试梯度裁剪等方式失败后,我设计了几个小trick使网络可以在NAN后自动读取上一个保存的模型重新训练,却因为读取时无法释放显存导致显存不足而失败,之后只好在每次NAN之后手动停止,从人训练模型变成了模型训练人,在练了几天之后,提交了一个还算看得过去的结果。

之后我的工作主要就是帮助别的组员进行一些debug,在与大家交流的过程中,我感受到的是前所未有的快乐。因为我本身并不是计算机专业的,所以之前并没有一个很好的机会与同样做CV的同学们讨论,在几天的交流中,我能明显的感觉到自己对于一些计算机基本问题的短板被补齐了。同时,我们组的氛围也从未有比赛的那种紧迫感,一直斗嘴相爱相杀的天伦和丙晨、沉稳靠谱却又有时语出惊人的开聪、活泼可爱却只爱吃黄焖鸡的组长雯倩,能够在这样一个快乐的小组也是足够幸运的。

很感谢百度飞桨团队能够提供这样一次实习的机会,谢谢可爱的安迪姐和楠哥半个月以来的照顾,谢谢研发老师细心的指导,以及感谢每次我去想拿好吃的零食都热心帮我寻找的哥哥姐姐们,希望未来与大家在百度再会~

0
收藏
回复
全部评论(2)
时间顺序
V
VanessaNi
#2 回复于2021-11

不错

0
回复
安然jdjdj
#3 回复于2021-11

太棒了

0
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户