回归

本页目录


GBDT回归

pipeline.mllib.regression.gbdt_regression_v2.GradientBoostingRegressorV2Ai

image.png
image.png

组件说明:GBDT回归组件,是一种迭代的决策树算法,将多颗决策树的结果累加起来作为最终的预测输出。进行回归预测。
组件输入:输入预处理后需要待处理的数据表。
组件输出:输出训练后的回归模型和特征重要性。

输入桩input

  • input1:输入待处理的数据表。

输出桩output

  • output1:输出特征重要性。

  • output2:输出GBDT二分类模型。

字段设置

  • col: 输入列,支持double、int类型字段

  • label: 标签列名

内存设置

  • 占用内存大小:可设置组件占用的内存大小,范围[256,64*1024]MB,默认512MB。

  • 并发数:可设置组件的并发数,范围[1,9999],默认为1,单线程运行。

模型参数setting

参数名称 参数描述 参数可选项 默认值

loss

损失函数类型

{'ls', 'lad', 'huber', 'quantile'}

'ls'

alpha

alpha值

[0,1]

0.9

n_estimators

树数量

[1, +inf)

100

learning_rate

学习率

(0, 1.0]

0.1

max_depth

树的深度

[1, +inf)

5

min_samples_leaf

每个叶子节点所属的最少样本个数或比例

[1, +inf)

1

subsample

样本采样比例

(0, 1.0]

1.0

max_features

特征采样比例

(0, 1.0]

1.0

validation_fraction

测试样本比例

[0,1)

0.1

random_state

随机数种子

[0, +inf)

0