归一化问题
收藏
这个仅仅对训练集计算最大值、最小值和均值来对所有数据(训练集+测试集)进行归一化处理,是不是有问题啊?
0
收藏
请登录后评论
对对,改下就好
数据归一化应该是先把所有数据归一化,然后再划分为训练集与测试集吧?
没问题呀。对数据进行归一化时候,类似最大值、最小值等指标都是在训练集上计算出来的。
因为你想想,训练一个模型,然后实际拿模型去用的时候,输入的数据肯定要进行和训练时候一样的处理,也就是按照同一个标准。
这个标准就是根据训练集上计算出来的各种指标。实际拿模型去用的时候,肯定是不知道实际数据集上的各种指标的。
所有值的归一化。嗯嗯,包括测试集
厉害了