AutoML自动调参

什么是AutoML

AutoML(Aotomatic Machine Learning)在机器学习领域应用已逐渐成熟,可帮我们解决手动调参的烦恼,自动筛选出最优的特征、模型的超参数、将最优的参数向下传导。常用的自动调参方法包含Grid Search、Random Search、贝叶斯调参、TPE等。

模型自动调参

AIWorks的2种建模方式中,Notebook的自动调参可用过代码直接引用调参方法实现,可视化实验模型的自动调参,系统封装了相应的界面来实现。

机器学习模型中的分类、聚类、回归、时间序列模型都可支持调参,AotoML步骤如下:

步骤一: 在可视化实验编辑页面中,点击AutoML按钮,选择需要调参的机器学习模型;
步骤二: 选择调参方式,并填写调参方式的具体参数、设置CPU并发数;
步骤三: 设置模型参数取值,每个超参数可取多个值,系统将根据调参算法计算出最优的参数值。填写多个参数值时,值中间用英文逗号分隔开;

flower

步骤四: 调参参数设置完成,开始模型运行。系统将会根据模型数量运行多个模型,并挑选出最优的模型向下传输;

AotoML调参完成后,模型参数将会替换成最优的模型参数,且最优模型参数将打印在日志中。

每次只能对一个模型调参,且单次模型生成数量不能超过50个,运行模型数量=各参数的值个数乘积.

支持AotoML的机器学习模型如下:

模型分类 模型名称

分类

逻辑回归二分类

分类

GBDT二分类

分类

随机森林分类

分类

支持向量机

分类

线性支持向量机

回归

随机森林回归

回归

GBDT回归

聚类

KMeans聚类

时间序列

Serima

特征自动选择

特征工程的自动选择,可通过“前向特征选择”、“后向特征选择”组件实现,在可视化实验中进行特征筛选。

  • 前向特征选择:使用XGboost模型筛选最佳特征,通过输入初始特征名,在此之上添加能够提升XGboost分类性能的特征名,得到最优特征的方法;

  • 后向特征选择:使用XGboost模型筛选最佳特征,通过输入初始特征名,在此之上添加能够降低XGboost分类性能的特征名,得到最优特征的方法;