数据标准化:提高模型收敛速度:某些机器学习算法(如梯度下降)在优化过程中对输入特征的尺度敏感。如果特征的尺度差异很大,模型可能需要更多的迭代才能达到收敛。通过标准化,可以加快模型的收敛速度,提高训练效率。标准化可以减小数据中的噪声和异常值对模型的影响。通过将数据映射到较小的数值范围,标准化可以使模型对于数据中的小波动更加稳定,减少了异常值对模型参数的扰动。
在本项目中通过观察可以发现最大值对数据的影响较大,并存在缺失值,所以在数据标准化后,将缺失值补零,最大值替换成单个feature下的平均值