![](https://box.kancloud.cn/ce23587aa27e9552c344eaa8879b8071_939x537.png)
登陆成功后,可以启动机器学习训练任务流程,简要的流程如下:
(1)数据上传
ORION公有云版本支持结构化数据上传(CSV文件),在数据模块,点击“上传新数据” ,出现如下页面:
· 需要用户命名数据集
· 生成ID列:若数据集内无Index,则可滑动确认,平台将自动生成索引列
· 将数据文件拖拽至平台选框内
数据上传中,进度条显示数据上传进度,完成后,点击上传按钮,进入数据预览页面。
![](https://box.kancloud.cn/53ceda25f9b79cbe2bdda0b061f23e8c_939x547.png)
(2)数据预览及下载
数据预览可预览数据集前十行,并可在所有数据中下载已上传的数据集。
![](https://box.kancloud.cn/f8f1c6e7963201fb9c50260895708b9d_939x547.png)
(3)创建任务
在训练模块中,点击“创建任务”,弹出创建任务的窗口,包含如下内容:
· 任务名称:用户需要为新任务命名;
· 数据名称:点击窗口,出现下拉框,可选择已上传的数据集;
· 模型类型:可选择非网络模型,网络模型(包含DNN,CNN,RNN,TCN)
· 问题类型:支持分类,回归,聚类,时间序列问题
· 任务类型:包含手动训练(single train),自动训练(hyper train),集成训练(ensemble train)
用户可根据任务目标选择配置,点击创建任务进入下一步。
![](https://box.kancloud.cn/951ca79fd0f571d17951c09089382c9d_939x547.png)
(4)任务配置
任务配置包含四个步骤:配置预处理,配置数据,选择算法,配置输出
· 配置预处理
配置预处理中是对数据集的预处理操作,包含如下可配置内容:
o ID列名:即指定数据集中的索引列,可通过下拉框选择;
o Target列名:为需要预测的列名;
o Shuffle:是否需要随机打乱数据(非时间序列数据可选);
o Do\_re\_fit:是否合并训练与测试数据再次训练,若是则置为True,默认不选择;
o 数据切割形式:将数据集分为训练集和测试集的方式与比例;
![](https://box.kancloud.cn/64a66c9023b576f69737ad8b24b9d95a_939x547.png)
· 配置数据
配置数据中,用户可对每一列数据进行预处理,包括数据变换和空值处理,用户无需编程,可对数据进行快速预处理,同时可对数据进行理解,包含数据最大最小值,缺失值比例等。
![](https://box.kancloud.cn/052a7aaf7dbc8259d3e3eb4084160fb1_939x547.png)
· 选择算法
在算法选择模块中,用户可对算法进行选择与配置,以全连接神经网络为例,用户可视化选择全连接层数,每层单元数,及网络参数等,用户可以选择默认配置进行下一项目。
![](https://box.kancloud.cn/cac3d0275e2b1685b957257c4d3bf59a_939x547.png)
· 评估方法
在模型指标的选择中,用户可自定义选择指标,可多选。
![](https://box.kancloud.cn/8b2c8b89e0a75864d6717bfa2d4693e5_939x547.png)
用户完成四个步骤后,用户可在所有任务的列表内查看待训练的任务,并可查看训练进度:
![](https://box.kancloud.cn/b877e46a80f134640362db717361619a_939x249.png)
![](https://box.kancloud.cn/d2a85bfac94f6ab7ac5f8dc29998482d_939x249.png)
训练任务成功完成后,后台将保存任务,并可在预测任务内调用。
![](https://box.kancloud.cn/698d36ecd20a5aaf36e2027ccd108908_939x249.png)