《Vision Transformer打卡营》正式上线啦!百度研究院深度学习研究室资深研究员朱欤博士全程授课,六位专业助教全程答疑,十节课带你玩转ViT爆款模型!中文授课,完全开源!
开课时间:11月月23日— 12月2日,每晚 20:30准时开始直播授课~
课程链接(回放、配套实践):https://aistudio.baidu.com/aistudio/course/introduce/25102
官方Q群(答疑、技术交流):920200490
另外,通关即可获得官方认证结业证书,赢取HHKB机械键盘、米歇尔无线重低音音箱、小度智能屏、小度蓝牙耳机、小度电子秤、小度音箱、百度网盘会员、不同金额的京东卡、样式多样的小度熊等多种实用奖品~
加入课程,再也不用担心读不懂论文、看着代码不知所措、训练模型只懂调包以及明明知道自身存在的不足却没有系统的课程;本课程将有针对性的解决大家普遍产生的问题,详解论文、手推公式、现场直播带写代码。先夯实基础,再实践加固,在十天内做到真正对ViT从入门到精通。
课程亮点
1. Vision Transformer前沿技术全面讲解|从ViT经典算法到最新学界前沿,从技术原理到实现细节, ViT, Swin, DETR逐个带你掌握视觉算法新范式。
2. 论文分析 + 逐行Coding,现场板书,手推公式|详细解析论文要点,每节课有一半时间会带着大家现场写代码~带大家实现自己的ViT模型,对小白也很友好。
3. 全程carry 玩转ViT|课程内容完全开源、全程中文直播授课、高水平助教团队社群内答疑、配套有不同难度的实践任务以满足各阶段学习需求,并提供免费GPU算力支持!
4. 多位大佬全程辅助|全程直播+技术团队答疑+作业讲评+学习激励,让你的学习有见证有收获,求职有帮助!
你将收获
无论你是刚接触深度学习,还是已经在做科研,无论你是CV想转NLP,还是NLP想搞CV,又或者你想用最新的视觉技术打比赛、发论文,通过学习《Vision Transformer十讲》,你都将获得将论文中的模型图变成一行行代码的能力,告别简单的git clone和调包!
讲师介绍
朱欤博士,百度研究院深度学习实验室资深研究员、飞桨PPDE(开发者技术专家)、AI顶会审稿人。拥有美国硅谷一线工作经验,现于百度研究院负责深度学习和视觉算法研发。曾发表多篇高水平论文,近年来多次在CVPR, ICCV, ECCV等顶会上的国际比赛中获得top名次,人送外号“手敲代码的神”。
课程大纲
第一讲
理论:Hello, Vision Transformer!
实践:Warmup:模型搭建和训练
第二讲
理论:从Transformer到Vision Transformer
实践:玩转Tensor操作,开始搭建ViT
第三讲
理论:你看你的,我看我的之详解注意力
实践:Multi-Head Self Attention
第四讲
理论:搭建你的第一个ViT模型
实践:如何实现ViT模型
第五讲
理论:ViT模型搭建好了,如何高效训练?
实践:实战模型搭建和训练
第六讲
理论:什么是Window Attention?
实践:图像窗口上的注意力机制
第七讲
理论:大名鼎鼎的Swin Transformer
实践:实现你的第二个ViT模型
第八讲
理论:Conv和Transformer的结合
实践:从框架源码看如何实现数据加载
第九讲
理论:带你了解前沿算法:视觉上的BERT
实践:模型训练的技巧
第十讲
理论:检测算法新范式-DETR
实践:实战ViT训练测试全流程
写在最后
“取乎其上,得乎其中;取乎其中,得乎其下;取乎其下,则无所得矣”,锁定ViT打卡营,希望大家放宽视野,定高目标,最后都能取得自己满意的结果!
赞~
有点顶
学习了