企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
![](https://box.kancloud.cn/ce23587aa27e9552c344eaa8879b8071_939x537.png) 登陆成功后,可以启动机器学习训练任务流程,简要的流程如下: (1)数据上传 ORION公有云版本支持结构化数据上传(CSV文件),在数据模块,点击“上传新数据” ,出现如下页面: · 需要用户命名数据集 · 生成ID列:若数据集内无Index,则可滑动确认,平台将自动生成索引列 · 将数据文件拖拽至平台选框内 数据上传中,进度条显示数据上传进度,完成后,点击上传按钮,进入数据预览页面。 ![](https://box.kancloud.cn/53ceda25f9b79cbe2bdda0b061f23e8c_939x547.png) (2)数据预览及下载 数据预览可预览数据集前十行,并可在所有数据中下载已上传的数据集。 ![](https://box.kancloud.cn/f8f1c6e7963201fb9c50260895708b9d_939x547.png) (3)创建任务 在训练模块中,点击“创建任务”,弹出创建任务的窗口,包含如下内容: · 任务名称:用户需要为新任务命名; · 数据名称:点击窗口,出现下拉框,可选择已上传的数据集; · 模型类型:可选择非网络模型,网络模型(包含DNN,CNN,RNN,TCN) · 问题类型:支持分类,回归,聚类,时间序列问题 · 任务类型:包含手动训练(single train),自动训练(hyper train),集成训练(ensemble train) 用户可根据任务目标选择配置,点击创建任务进入下一步。 ![](https://box.kancloud.cn/951ca79fd0f571d17951c09089382c9d_939x547.png) (4)任务配置 任务配置包含四个步骤:配置预处理,配置数据,选择算法,配置输出 · 配置预处理 配置预处理中是对数据集的预处理操作,包含如下可配置内容: o ID列名:即指定数据集中的索引列,可通过下拉框选择; o Target列名:为需要预测的列名; o Shuffle:是否需要随机打乱数据(非时间序列数据可选); o Do\_re\_fit:是否合并训练与测试数据再次训练,若是则置为True,默认不选择; o 数据切割形式:将数据集分为训练集和测试集的方式与比例; ![](https://box.kancloud.cn/64a66c9023b576f69737ad8b24b9d95a_939x547.png) · 配置数据 配置数据中,用户可对每一列数据进行预处理,包括数据变换和空值处理,用户无需编程,可对数据进行快速预处理,同时可对数据进行理解,包含数据最大最小值,缺失值比例等。 ![](https://box.kancloud.cn/052a7aaf7dbc8259d3e3eb4084160fb1_939x547.png) · 选择算法 在算法选择模块中,用户可对算法进行选择与配置,以全连接神经网络为例,用户可视化选择全连接层数,每层单元数,及网络参数等,用户可以选择默认配置进行下一项目。 ![](https://box.kancloud.cn/cac3d0275e2b1685b957257c4d3bf59a_939x547.png) · 评估方法 在模型指标的选择中,用户可自定义选择指标,可多选。 ![](https://box.kancloud.cn/8b2c8b89e0a75864d6717bfa2d4693e5_939x547.png) 用户完成四个步骤后,用户可在所有任务的列表内查看待训练的任务,并可查看训练进度: ![](https://box.kancloud.cn/b877e46a80f134640362db717361619a_939x249.png) ![](https://box.kancloud.cn/d2a85bfac94f6ab7ac5f8dc29998482d_939x249.png) 训练任务成功完成后,后台将保存任务,并可在预测任务内调用。 ![](https://box.kancloud.cn/698d36ecd20a5aaf36e2027ccd108908_939x249.png)