强化学习7日小记
是更新Q表格的方式。
Sarsa是on-policy的更新方式,先做出动作(真实发生的动作)再更新。
Q-learning...
降维算法
在机器学习中,随着数据特征的增加,需要更大的计算资源来训练模型。这可能导致模型的训练时间和内存消耗增加,甚至可能导致模型无法训练或训练结果...
平台体验真的不好
PaddlePaddle。
数据保存错乱,说好的永久保存数据,每次打开项目,/home/aistudio/目录下的自己的数据从来没完整保存过。。。还玩啥?甚至...
损失函数在神经网络中的作用
损失函数是衡量我们的网络模型的输出与真实标签之间的差距的。损失函数设计的好坏直接关系到模型最终能收敛到的程度。深度学习的训练过程是输入...
文本分类有什么建议吗?
端分离数据收集分析系统、实现数据应用处理需求;负责连接后台SQL Server各类数据源功能实现及运行优化;负责用HTML前端网页交互界面开发...
动态图(命令式编程)实现波士顿房价预测
数据和测试数据使用源数据,需要自己实现归一化、训练集和测试集划分,本文则直接使用paddle内置数据集uci_housing。通过对比两种数据格式的处理,可以拓展思维,加深理解。
本文增加了VDL2的可视化实现
...