交叉验证

=交叉验证=

概念
交叉验证(Cross-validation)主要用于建模应用中，例如PCR 、PLS 回 归建模中. 在给定的建模样本中，拿出大部分样本进行建模型，留小部分样本用刚建立的模型进行预报，并求这小部分样本的预报误差，记录它们的平方加和. 这个 过程一直进行，直到所有的样本都被预报了一次而且仅被预报一次. 把每个样本的预报误差平方加和，称为PRESS(predicted Error Sum of Squares).

目的
用交叉验证的目的是为了得到可靠稳定的模型. 在建立PCR 或PLS 模型时，一个很重要的因素是取多少个主成分的问题？用cross validation 校验每个主成分下的PRESS值，选择PRESS值小的主成分数. 或PRESS值不在变小时的主成分数. [1]] 　　常用的精度测试方法主要是**交叉验证**，例如10倍交叉验证(10-fold **cross validation**)，将数据集分成十分，轮流将其中9份做训练1份做测试，10次的结果的均值作为对算法精度的估计，一般还需要进行多次10倍交叉验证求均值，例如：**10次10倍交叉验证**，以求更精确一点. **交叉验证**有时也称为**交叉比对**，如：10倍交叉比对