ThinkChat🤖让你学习和工作更高效,注册即送10W Token,即刻开启你的AI之旅 广告
在**训练数据**上**训练模型** => 在**验证数据**上**评估模型**,一旦找到了最佳参数=>就在**测试数据**上最后**测试**一次。 ***** #### **为什么不是两个集合:一个训练集和一个测试集?**~~在训练集上训练模型,然后在测试集上评估模型~~ 因为在于开发模型时**总是需要调节**模型配置:选择层数或每层大小(模型的超参数(hyperparameter),以便与模型参数(即权重)区分开),这个调节过程需要使用模型在验证数据上的**性能**作为**反馈信号**。 这个调节过程本质上就是一种**学习**:在某个参数空间中寻找良好的模型配置。 =》基于模型在**验证集**上的**性能**来**调节**模型配置,会很快导致模型**在验证集上过拟合**,即使你并没有在验证集上直接训练模型也会如此。 **信息泄露**(information leak): 每次基于模型在验证集上的性能来调节模型超参数,都会有一些**关于验证数据的信息**泄露到模型中。 最后,你得到的模型在验证集上的性能非常好(**人为造成的**)