在机器学习任务的核心是训练方式的选择,包括以下功能:
2.3.1 普通训练(Single Train)
普通训练是指确定模型以及模型参数的训练,适⽤用于有⼀一定机器器学习背景的⼈人员,可以针对特定的数据⾃自⼰己指定合适的模型及模型参数。
2.3.2 自动化超参训练(Hyper Train)
平台同时支持对模型的参数进行优化搜索,即自动化超参数调优,避免用户手动调参的低效。这种模式下,用户只需要上传数据,选择若干机器学习模型即可,平台将自动搜索出每个模型的最优参数。包含的优化算法为:
· Grid\_Search
· Random\_Search
· SMAC
· TPE
· ANNEAL
2.3.3 集成训练(Ensemble Train)
集成方法是将⼏种机器学习算法组合成⼀个预测模型的训练方式,以达到减小方差、偏差或改进预测的效果。本平台的集成训练是基于 stacking 的集成学习技术,通过元分类器或元回归(Meta-Model )聚合多个基分类或回归模型( Base-Model )。其中基模型( Base-Model ) 基于完整的训练数据进行训练,然后元模型( Meta-Model )基于基模型的输出结果进行训练。
2.3.4 模型评估
任务设置中支持多种机器学习模型的技术评估指标,分别如下:
分类评估:
· 准确率
· 召回率
· F1分数
· ROC曲线
· AUC
· KS
回归评估:
· MAE
· MSE
· RMSE
· MSLE
· MDAE
· R Square
· MAPE
聚类评估
· ARI
· FMI
· SC
· CHI
时间序列评估
· 残差平方和
· 残差图