首页 飞桨菁英计划 帖子详情
【飞桨菁英计划】————实习日志
收藏
快速回复
飞桨菁英计划 文章实习就业 440 0
【飞桨菁英计划】————实习日志
收藏
快速回复
飞桨菁英计划 文章实习就业 440 0

从10月20日到11月4日,两周在飞桨的学习生活令我受益颇多,对于论文复现的理解有了新的认识和看法。

在个人复现赛的阶段,我对论文复现的打卡点的知识比较生疏,复现的过程不是很顺利,出现了一个问题之后就难以进展下去。之后,在百度与其他小伙伴交流之后,才发现只是一个paddle和pytorch的key值差异问题,在学习文档中有标注过。这件事情也让我意识到完整认真的阅读文档的重要性。

在组队复现阶段,我的第一篇复现论文是基于RN网络的VQA问题。在源码转paddle代码的方面,我在初始阶段实现速度较慢,后来在队友的帮助下学习了快速查找API和对照表的方法。对于还没有实现的API,需要在了解源码功能的基础上进行编写,有时可能只是简单的方法的组合。在前向对齐的时候,再次出现了个人赛中出现过的diff对不齐的情况,通过二分法排查后,关闭了随机的dropout层,实现了前向对齐。在接下来的对齐过程中,还出现了诸如运行超出内存,数据保存加载出错,reprod工具使用等相关的问题,但好在都比较顺利地解决了,最终和队友成功复现了这一篇论文。

在《阿甘正传》中有这样一句台词:"人生就像一盒巧克力,你永远不知道下一颗是什么味道。当你遇到困难的时候,也许下一刻就会迎来奇迹。当你以为好日子来的时候,下一刻也许就危及生命。无常是人生的常态。"是的,在下面的论文复现中,出现了因为稀疏张量无法实现的问题不得放弃重选。然而重选的文章CASENET数据集处理过慢,可能几天都无法处理好的数据使我们难以成功复现,只能尽可能完成前几步的对齐工作。这段时间是有些无奈和纠结的,对齐中出现的各种爆内存和框架差异导致的数据类型错误使我的对齐工作举步维艰。好在在与指导老师和队友的交流下完成了对齐工作。

目前在做的论文是K-Bert的NLP任务,和之前的CV方向的任务有一些不一致的地方,且优化器的部分有一些自己的参数。这里要感谢我的队友实现了优化器的重写工作,令我们的复现任务可以继续完成。在论文对齐的过程中,在step1就出现了问题,在接近半天时间的排查后才完成了第一步对齐。接下来顺利地完成了step3后,我们在step2上迟迟无法对齐,最后在老师的帮助下发现了问题,是一个简单的重新加载权重的问题,但由于我没有察觉,导致浪费了很多时间,感觉很自责和抱歉。目前这篇论文还在训练,希望有一个好的结果吧。

PS:写在最后

如果用一个词来形容这次的活动,那么我会选择"挣扎"。挣扎着起床,挣扎着选题,挣扎着调试......但挣扎不是坏事,在我看来这是一种自我驱动式的前进。此外学会正确消化情绪,不要将自己的不良情绪传递给他人也是我要继续学习的。人是复杂的,情感也是复杂的,很难评价一段经历的感受,但可以估量经历的价值,毫无疑问,这次经历是值得的,感激现在所拥有的一切并继续去感受生活。

0
收藏
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户