Shuffle
机器学习当中的Shuffle是数据预处理的一种方式。
我的理解是,当我们所求的一组或一个输出只由一组或一个输入决定时,输入与输出是一种“一对一”的关系。
\[(X_1,X_2,....,X_n) --> (Y_1,Y_2, ..., Y_n)\]例如,当前时刻的输出$Y$只由当前时刻的输入$X$决定,而没有前后历元的依赖关系,那么,将输入输出对$(X_i,Y_i)$进行随机排列,输入到模型当中,就不会影响其结果。
在这种情况下,训练集最好进行Shuffle处理。
机器学习当中的Shuffle是数据预处理的一种方式。
我的理解是,当我们所求的一组或一个输出只由一组或一个输入决定时,输入与输出是一种“一对一”的关系。
\[(X_1,X_2,....,X_n) --> (Y_1,Y_2, ..., Y_n)\]例如,当前时刻的输出$Y$只由当前时刻的输入$X$决定,而没有前后历元的依赖关系,那么,将输入输出对$(X_i,Y_i)$进行随机排列,输入到模型当中,就不会影响其结果。
在这种情况下,训练集最好进行Shuffle处理。