回归
GBDT回归
pipeline.mllib.regression.gbdt_regression_v2.GradientBoostingRegressorV2Ai


组件说明:GBDT回归组件,是一种迭代的决策树算法,将多颗决策树的结果累加起来作为最终的预测输出。进行回归预测。
组件输入:输入预处理后需要待处理的数据表。
组件输出:输出训练后的回归模型和特征重要性。
输入桩input
-
input1:输入待处理的数据表。
输出桩output
-
output1:输出特征重要性。
-
output2:输出GBDT二分类模型。
字段设置
-
col: 输入列,支持double、int类型字段
-
label: 标签列名
内存设置
-
占用内存大小:可设置组件占用的内存大小,范围[256,64*1024]MB,默认512MB。
-
并发数:可设置组件的并发数,范围[1,9999],默认为1,单线程运行。
模型参数setting
参数名称 | 参数描述 | 参数可选项 | 默认值 |
---|---|---|---|
loss |
损失函数类型 |
{'ls', 'lad', 'huber', 'quantile'} |
'ls' |
alpha |
alpha值 |
[0,1] |
0.9 |
n_estimators |
树数量 |
[1, +inf) |
100 |
learning_rate |
学习率 |
(0, 1.0] |
0.1 |
max_depth |
树的深度 |
[1, +inf) |
5 |
min_samples_leaf |
每个叶子节点所属的最少样本个数或比例 |
[1, +inf) |
1 |
subsample |
样本采样比例 |
(0, 1.0] |
1.0 |
max_features |
特征采样比例 |
(0, 1.0] |
1.0 |
validation_fraction |
测试样本比例 |
[0,1) |
0.1 |
random_state |
随机数种子 |
[0, +inf) |
0 |