机器学习当中shuffle

Shuffle

机器学习当中的Shuffle是数据预处理的一种方式。

我的理解是,当我们所求的一组或一个输出只由一组或一个输入决定时,输入与输出是一种“一对一”的关系。

\[(X_1,X_2,....,X_n) --> (Y_1,Y_2, ..., Y_n)\]

例如,当前时刻的输出$Y$只由当前时刻的输入$X$决定,而没有前后历元的依赖关系,那么,将输入输出对$(X_i,Y_i)$进行随机排列,输入到模型当中,就不会影响其结果。

在这种情况下,训练集最好进行Shuffle处理。

参考资料

机器学习,深度学习模型训练阶段的Shuffle重要么?为什么?_NLP翟-CSDN博客_深度学习shuffle

数据集shuffle的重要性 - 知乎