Vision Transformer打卡营来啦！朱欤博士带你玩转ViT爆款模型

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

项目

数据集

课程

比赛

模型库

活动

论坛

访问飞桨官网

桨桨发布于2021-11

《Vision Transformer打卡营》正式上线啦！百度研究院深度学习研究室资深研究员朱欤博士全程授课，六位专业助教全程答疑，十节课带你玩转ViT爆款模型！中文授课，完全开源！

开课时间：11月月23日— 12月2日，每晚 20:30准时开始直播授课～

课程链接（回放、配套实践）：https://aistudio.baidu.com/aistudio/course/introduce/25102

官方Q群（答疑、技术交流）：920200490

另外，通关即可获得官方认证结业证书，赢取HHKB机械键盘、米歇尔无线重低音音箱、小度智能屏、小度蓝牙耳机、小度电子秤、小度音箱、百度网盘会员、不同金额的京东卡、样式多样的小度熊等多种实用奖品～

加入课程，再也不用担心读不懂论文、看着代码不知所措、训练模型只懂调包以及明明知道自身存在的不足却没有系统的课程；本课程将有针对性的解决大家普遍产生的问题，详解论文、手推公式、现场直播带写代码。先夯实基础，再实践加固，在十天内做到真正对ViT从入门到精通。

课程亮点

1. Vision Transformer前沿技术全面讲解｜从ViT经典算法到最新学界前沿，从技术原理到实现细节, ViT, Swin, DETR逐个带你掌握视觉算法新范式。

2. 论文分析 + 逐行Coding，现场板书，手推公式｜详细解析论文要点，每节课有一半时间会带着大家现场写代码～带大家实现自己的ViT模型，对小白也很友好。

3. 全程carry 玩转ViT｜课程内容完全开源、全程中文直播授课、高水平助教团队社群内答疑、配套有不同难度的实践任务以满足各阶段学习需求，并提供免费GPU算力支持！

4. 多位大佬全程辅助｜全程直播+技术团队答疑+作业讲评+学习激励，让你的学习有见证有收获，求职有帮助！

你将收获

无论你是刚接触深度学习，还是已经在做科研，无论你是CV想转NLP，还是NLP想搞CV，又或者你想用最新的视觉技术打比赛、发论文，通过学习《Vision Transformer十讲》，你都将获得将论文中的模型图变成一行行代码的能力，告别简单的git clone和调包！

讲师介绍

朱欤博士，百度研究院深度学习实验室资深研究员、飞桨PPDE（开发者技术专家）、AI顶会审稿人。拥有美国硅谷一线工作经验，现于百度研究院负责深度学习和视觉算法研发。曾发表多篇高水平论文，近年来多次在CVPR, ICCV, ECCV等顶会上的国际比赛中获得top名次，人送外号“手敲代码的神”。

课程大纲

第一讲
理论：Hello, Vision Transformer!
实践：Warmup：模型搭建和训练
第二讲
理论：从Transformer到Vision Transformer
实践：玩转Tensor操作，开始搭建ViT
第三讲
理论：你看你的，我看我的之详解注意力
实践：Multi-Head Self Attention
第四讲
理论：搭建你的第一个ViT模型
实践：如何实现ViT模型
第五讲
理论：ViT模型搭建好了，如何高效训练？
实践：实战模型搭建和训练
第六讲
理论：什么是Window Attention？
实践：图像窗口上的注意力机制
第七讲
理论：大名鼎鼎的Swin Transformer
实践：实现你的第二个ViT模型
第八讲
理论：Conv和Transformer的结合
实践：从框架源码看如何实现数据加载
第九讲
理论：带你了解前沿算法：视觉上的BERT
实践：模型训练的技巧
第十讲
理论：检测算法新范式-DETR
实践：实战ViT训练测试全流程