一、缘起
三年前,为什么会认识AI Studio呢?大概是这样……
(PS:说来好笑,现在这个搜索结果里基本看不到百度自家的AI Studio,哈哈哈)
二、开源之初
虽然当时其实注册了账号,但应该说在长达半年的时间里,都没怎么用起来。好在平台有创建日期的记录,翻翻当初的项目,也可见一些端倪。
规则和现在一样,当时AI Studio虽然提供几乎连续的免费算力,但必须使用飞桨框架。于是过去TF、Keras、PyTorch换着用的我,只好翻翻Paddle的模型库试着跑个Demo。虽然项目很不成熟,不过印象中那时平台上没太多类似的教程,也就厚脸皮地开源了,希望能帮到后面的新用户。
(这几个最早的项目还有上百Fork也是震惊的……导致一直纠结着没删掉,留下了历史记录哈哈哈)
一个月后,因为报名了某平台的比赛需要算力,这回,重要正儿八经地研究如何将飞桨的模型库用于实战,如何做数据清洗,如何配置config文件,如何将预测结果处理为需要提交的格式……同时,我发现PaddleDetection这个模型库还是非常好用的,因此这番尝试,也开始了各种瑕疵检测、安全帽检测等等项目的开发历程。
什么时候开始认真写开源项目?这要从写精品送积分开始。印象中那时候宋迪老师在群里宣传了这个活动,当时我这个深度学习小白,弱弱地问,如果是没有用飞桨框架写的机器学习项目,可以投稿么?收到了肯定的答复,于是就有了【用户购买预测基线】这么一个系列。
【用户购买预测】这个系列,应该也是我第一次在AI Studio上打比赛。不过我参赛的原因可能比较与众不同,是因为当时公司有个业务场景和这个比赛的数据非常类似。当然,对于我等小白,这么一系列项目肯定不是从0开始写的。在国外某竞品平台上,早有类似解决方案,只不过散落在多个比赛中,而且还需要一些数据预处理。就这样,在参考借鉴开源方案的过程中,我就把这一系列解决方案在用户购买预测比赛复现了。
三、小白进阶
不过,虽然有了一些精品项目,我依然还是个深度学习方面的小白。虽然会照着文档用点模型库,但是理论知识还相当欠缺。好在AI Studio上推出了各类课程,简直就是及时雨!
应该说,最开始参加这些7日打卡课的时候,那是喜忧参半。喜的是这些课程真是精品,大佬们讲得深入浅出,忧的是,这时间也有太紧凑了!几乎每天都有课,而且当天课程作业提交截止时间往往是第二天中午……对于我等小白,实在是有点难,以至于很多时候,优秀学员、作业抽奖什么的,都赶不上啊。
不过后来想想,很多时候,学习也是一鼓作气、再而衰、三而竭的过程,很多资料收集下来,三天打鱼两天晒网也就忘了;多少书籍翻开,只看了个开头。7日课程形式其实非常好,能跟下来,收获绝对是满满的。深度学习工程师集训营、目标检测、图像分割、强化学习、PGL……这系列课程个个精品。再后来,自己从学员变成助教,甚至能偶尔当当入门课程的讲师,AI Studio上的这些经典课程功不可没。
四、写项目变成习惯
自从一不小心混上了AI Studio的榜单,然后又一不小心在榜首待了一段时间,经常会被问道这个问题:为什么会写这么多开源项目?
其实我想说:因为写项目有积分啊,不写还会被催稿(哈哈哈逃……)。
当然也不全是为了积分,客观上是自己本地建的博客站不稳定,放在公司服务器里,搬了几次家;放在自己机器里,硬盘挂了= =
另一方面,AI Studio这类平台,直接用Jupyter Notebook形式开源项目,兼具文章阅读和fork即运行功能,本就是一种非常好的开源载体。
搞IT基本都得写博客吧?只不过是把每周要写的博客搬了过来。
而且,开源同时也是一种约束,如果仅仅是把一段时间的学习成果单纯记录下来自己看,可能会写得比较随便;但是当我们要开源给各位读者看时,随之而来将提升自己对项目质量的要求,有时,不得不去翻阅更多的资料,确认某处理论介绍是否到位,再也不能囫囵吞枣;代码质量也有要求,该注释的地方,需要讲清楚。
五、结语
最后,当然要感谢AI Studio,它让我把深度学习变成了一种习惯。这里,深度学习既是关于AI的,也是关于知识的。
我在AI Studio上获得至尊等级,点亮10个徽章,来互关呀~
https://aistudio.baidu.com/aistudio/personalcenter/thirdview/90149
祝AI Studio三周岁生日快乐!
大佬那项目都是系列轰炸的!大写的佩服啊!~~
不是系列项目大水嘛,哈哈哈
涛涛江水~~
坑姐yyds,膜拜大佬
非常棒,向你学习!多写项目多学习!
ps,至尊项目限制到了之后,怎么办?
小白,小白……
我也想知道……
昨天写文章的时候发现我项目已经300了,写完立马删了几个旧项目,不过感觉再过几周马上又会封顶了= =
不是又会封顶,是又会登顶,毕竟排行榜一姐
坑姐yyds
经典版项目一般一个专题就要单开一个,
bml项目倒是可以多个主题放一起,但是操作起来不如经典版,而且不直观。
我一开始不知道这个限制,况且也好学,疯狂fork,所以很早在钻石就满了,升到了至尊才有了空间。
现在再也不敢乱fork了,但是准备向坑姐一样多写项目,所以未来大家都会碰到这个问题。
我想fork多的项目,可否奖励不占用总项目数。坑姐提提呗。
想多了哈哈哈
= =
大佬提醒了我,BML确实很适合写系列项目啊
不过这引来了另一个文档,就是加精奖励制度要与时俱进啊……
首先,BML如果是一系列项目,应该按有效notebook数给分吧?
然后,如果系列项目是向我这样吭哧吭哧慢慢填坑的,每次更新有分嘛,哈哈哈
我纯粹就是把项目当成博客日志记录了……导致数量就这么多起来了
太牛了!
没有没有,互相学习……
学习学习
坑姐YYDS
同样因为算力找到