DataWhaleAI夏令营——机器学习篇:DAY 1
收藏
快速回复
【飞桨学习赛】 文章学习资料 339 0
DataWhaleAI夏令营——机器学习篇:DAY 1
收藏
快速回复
【飞桨学习赛】 文章学习资料 339 0

赛题:锂离子电池生产参数调控及生产温度预测挑战赛

在线运行baseline时注意:一个单元格一个单元格地运行,否则可能会出现下面的单元格比上面的运行的要更快,然后出现训练集未被赋值的问题:

今日群里学习收获:

1:噪声数据的主要表现形式有三种:错误数据、假数据和异常数据。错误数据是指数据集中的错误或不一致的数据,例如重复数据、缺失值、不一致值等。假数据是指由于某种原因,数据集中的某些数据点是人工添加或修改的,例如虚假交易、虚假用户等。异常数据是指对数据分析结果有较大影响的离散数据,例如异常值、孤立点等。在处理噪声数据时,通常需要采取一些数据清洗和预处理的方法,例如分箱平滑、聚类等,以去除或修正噪声数据,提高数据质量和可靠性。
噪声数据通常指的是与真实数据不一致或存在偏差的数据,而重复数据则是指相同或相似的数据多次出现,形成了数据冗余。

2:提问的艺术:选项:先在各社区查阅相关文档,无果后清楚描述问题,使其清晰并突出重点
解释:1.自己解决问题这不仅有助于提高自己的技能,还能帮助更好地理解问题的本质;
2.问题简洁明了能够重点突出问题的关键点,让他人能够迅速理解自己所提出的问题,并给予正确的帮助。

0
收藏
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户