既然是“三周年”,那怎么也得说说第一次见面吧~~ ,蝴蝶的翅膀是那样开始扇动的。。。
2019年的一天,我看了姜导的《邪不压正》,惊奇电影里“好算数”的李天然,虽然算不对自己的脚离地多少米,但竟然能够算得准弹道,有本事躲开“让子弹飞”。这启发了我,自家的娃可得抓抓“好算数”啊,所以就在小度智能音箱上写了个《口算游戏》,让孩子寓教于乐学算数。等我写完了程序,孩子早已经学会了算加减法。但表示仍然愿意玩这个程序,真是懂事啊!虽然自家的娃没用上,但这个能让小盆友们在线pk的算数功能游戏,最高时每天能教几万个孩子在快乐中学算数,我也因此被邀请参加了2019年的百度AI开发者大会。我就是在那里首次见到了飞桨,带着满眼憧憬的星星和懵圈儿的星星,参加了一场又一场的演讲、论坛和 Workshop。
带我入门深度学习的是毕老师的两门课程《机器学习思考的故事》和《百度构架师手把手教深度学习》。前一门课程让我理解了大数据、机器学习、深度学习这些技术的理念。而后一门课真得是“手把手”教深度学习实践的“从入门到精通”,CV课程结束时,我还参加了“AI识虫练习赛”。可惜当时唯一会“改进模型”的地方就是做数据增强了,哈哈。比赛结束后,当我听那位和我同名同姓的大佬分享比赛经验时,心里的感觉怪怪的。他如何使用“模型集成”和“难例分析”等tricks,将目标检测模型的准确率刷到100%,则使我大为叹服、受益匪浅。一脚门里以后,我发现深度学习里CV更有趣,而CV里最好玩的则是GAN(生成对抗网络)。所以,后来我又上了李宏毅老师发布在 AI Studio 上的《生成对抗网络》课程。
俗话说:“最好的学习方式就是将学到的讲给别人听”。所以,但凡我学会了鼓捣点什么——从数据增强,到经典CNN网络,再到各种风格迁移的GAN网络,总要把项目发到 AI Studio 上得瑟一下~~ 。再牛的大佬也曾是小白啊。本着“服务大佬、态度认真”的想法,我将项目的代码跑通后,尽量还去找到文章、解读博客等背景资料丰富项目,这个过程也加深了我对模型的理解。
我读的深度学习的第一本书是李沐老师的《动手学深度学习》,这本非常适合入门。原版书里的代码是用 MXNet 写的,但我用的最熟的是 Paddle 框架,例程都是转换成 Paddle 的 API 跑的(毕竟 AI Studio 上的 GPU,“一直白嫖,一直爽”么~~ )。后来,我就加入了飞桨的 Book SIG(Special Interest Group),和组里的小伙伴们一起整理《动手学深度学习》用 Paddle 框架实现的源码。我有时间就会在 AI Studio 的论坛里聊天扯淡,然后就当了小版主,继续在坛子聊天扯淡。当然,有时也会帮论坛里的小伙伴们回答一些 Paddle 的使用问题。
在参加论文复现赛时,我选择了那篇《Semantic Image Synthesis with Spatially-Adaptive Normalization》,这正是我喜欢的GAN模型。为了达到比赛要求的复现精度,我逐层对齐复现模型与作者发布 PyTorch 模型的前向计算结果。这个复现的过程真是个“涨姿势”的过程,给我最大的收获就是:严格对齐精度不止是对复现的要求,更是对复现的帮助。这就好比,按着大厦作者的蓝图和样板复制大楼其实是最方便的。不然,由于哪部分管线的规格不对,导致大楼建成后没电没水。从头逐一排查可是费时、费力、费感情啊~~ 。
复现完成后,我又通过添加注意力、调整模型的结构和参数等 tricks 使模型的能力甚至超过了原作,而且大大轻量化。我想,为什么不将这个模型也做成一个游戏给小盆友们玩呢?于是就有了叫做《妙笔生画》的涂鸦H5小游戏。然后我就用这个项目参加了“AI达人创造营”,据说会在月底的峰会上展示哦。现在我正通过裁剪、蒸馏将模型进一步瘦身,然后部署在小度上, 它可是介绍我认识飞桨的“小红娘”啊,哈哈~~ 。我老早就加入了 PaddleGAN 的 SIG,因为 PaddleGAN 套件里的模型都是好玩的那种,比如做蚂蚁呀嗨的 First Order Motion、合成“后代”头像的 PSP 以及让图片的嘴唇动起来的 Wave2Lip 等。这次,我也正在将这个“妙笔生画”模型 PR 到PaddleGAN 上,感兴趣的小伙伴们不久就可以试试啦~。
最近,我正在参加 AICA 首席AI构架师培养计划五期班,上周刚刚在中关村国际会议中心上了第一次线下课程。课上听着飞桨的老师们指点江山、大牛同学们华山论剑,真是让我大开眼界。CV课程里老师介绍的 PaddleClas 套件的特征检索技术,对我正在做的“播控设备实时故障检测系统”非常有帮助。普通分类模型的类别是训练时就固定好的,添加新类别一般需要重新训练模型。如果能够将系统检测的每种故障现象的图片分别提取特征进行映射,检测时再与特征库进行比对,这种方法能够大大增强检测系统的灵活性。这次的课程让我受益匪浅,非常感谢谢梦老师、依欣老师的热情指导和帮助!
在 AI Studio 泡~了三年,非常感谢百度飞桨提供的这些丰富的平台、资源和机会,让我得见“知识的星辰大海”。我也很高兴能为开源事业添块砖头儿。据说写的 bug 也已经随 github 上的开源代码一起封存北极,去“恒久远、永流传”啦~~ 。
好家伙!敢情压线的不止我一个,哈哈哈哈
我是重度拖延症~~~~~
一样一样的