强化学习7日的心得体会
于深度学习的不确定性,然而,强化学习的不确定性还不只这些。例如想深度学习一般朝参设置对了,loss值一般收敛得到比较好,而给我的感觉像是...
CNN每次训练到step300就报错?
自动shuffle数据集的吗,为什么会出现这个固定的现象,想不明白……
话说有没有办法让它自动忽略这种出错的数据,加强一点适应能力,不然每次训练到300就直接功亏一篑,实在太难受了诶
...
AI达人养成营
学习的地方还有很多。不仅仅是写几行代码,它可以应用在很多地方。回想这六天的学习,每一天基本都在电脑前度过.从刚开始的新手小白,变成现在...
机器学习算法的好坏取决于
,和易理解性。我们总是想使用一套比较通用的算法来解决各种各样的任务,比如bert的出现。比如GAN的出现,在GAN之前,我们也可以使用VAE...
AR技术,让年画 活起来
越来越少,传承竟然成为了非遗文化目前面临的最大问题。
除了冯庆钜,百度还寻找到房志达、马习钦等多位老一辈非遗传承人,他们平均年龄74岁,虽已...
圣诞福利|答题or留言赢取暖冬礼包
的关注,小PP特别奉上暖冬礼包,答题或留言均有机会获得~具体方式如下,各位小伙伴们可任选一种参与~
方式一:12.26-1.1期间,回答5道...
作业2-1
train数据集的最大值,最小值,平均值
maximums, minimums, avgs = training_data.max(axis...
强化学习7日打卡营学习心得
要当前的状态、行动以及下一阶段的状态,对于下一行动,使用最优策略。这2类算法适用于状态空间与行动空间均离散可数的场景,Q表格不能太大...