### 随机拆分
> 交叉验证中最简单的方法之一是作为RandomSpilt类实现的。样本分为两组:训练组和测试组。您可以调整每组中的样本数。
### 构造函数参数
`$dataset` - 实现数据集接口的对象
`$testSize` - 测试拆分的一小部分(浮点数,从0到1,默认值:0.3)
`$seed` - 随机生成器的种子(例如用于测试)
```
$randomSplit = new RandomSplit($dataset, 0.2);
```
*****
### 样品和标签组
要从测试和训练组中获取样本或标签,您可以使用getter:
```
$dataset = new RandomSplit($dataset, 0.3, 1234);
// train group
$dataset->getTrainSamples();
$dataset->getTrainLabels();
// test group
$dataset->getTestSamples();
$dataset->getTestLabels();
```
- 基本介绍
- 关联规则学习
- 分类
- SVC
- k近邻算法
- NaiveBayes
- 回归
- 最小二乘法
- SVR
- 聚类
- k均值聚类算法
- DBSCAN聚类算法
- 公
- 准确性
- 混乱矩阵
- 分类报告
- 工作流程
- 神经网络
- 交叉验证
- 随机拆分
- 分层随机分裂
- 特征选择
- 方差阈值
- 特征选择
- 预处理
- 标准化
- 缺失值补全
- 特征提取(自然语言)
- 令牌计数矢量化器(文本处理)
- Tf-idf转换
- 数据集
- ArrayDataset
- CsvDataset
- FilesDataset
- SvmDataset
- MnistDataset
- 准备使用数据集
- Iris Dataset
- Wine Dataset
- Glass Dataset
- 模型管理
- 数学
- 距离
- 矩阵
- 组
- 统计