lightGBM Python API参考以及各参数意义

时间：2021-04-27 14:19:07 阅读：0 评论：0 收藏：0 [点我收藏+]

模型参数

参数名	参数描述	可选值
boosting_type	模型提升方式	‘gbdt‘、‘dart‘、‘goss‘、‘rf‘
num_leaves	每个基学习器的最大叶子	默认31
max_depth	基学习器树的最大深度	默认-1，没有限制
learning_rate	boosting学习率	默认0.1
n_estimators	基学习器的数量	默认10
max_bin	特征值的分桶数	默认255
subsample_for_bin	用于分箱的样本数	默认50000
objective	学习任务和学习目标	默认regression对于LGBRegressor，LGBClassifier是‘binary‘,‘multiclass‘,LGBMRanker是‘lambdarank‘
min_split_gain	在树的叶子节点上做进一步分区所需的最小损失减少	默认0，浮点数
min_child_weight	子节点(叶节点)中所需要的最小实例权重(hessian)之和	默认1e-3
min_child_samples	叶子所需要的最小数据	默认20
subsample	训练样本的子样本比率	默认1，浮点数
subsample_freq	子样本的频率	默认1，int
colsample_bytree	构造每棵树的子样本比率	默认1，浮点数
reg_alpha	L1正则化权重	默认0，浮点数
reg_lambda	L2正则化权重	默认0，浮点数
random_state	随机数种子	默认为None
n_jobs	并行线程数	默认为-1，全线程
slient	在运行提升时，是否打印消息	默认为True

参数	参数描述	可选值
X	输入特征矩阵	n_samples,n_features
y	标签	n_samples
sample_weight	训练数据的权重	默认None
init_score	初始化训练数据得分	默认None
group	训练集的分组数据	默认None
eval_set	用作提前停止的验证集的(X, y)	默认None
eval_names	eval_set的名字	默认None
eval_sample_weight	验证集数据的权重	默认None
eval_init_score	验证集数据初始分数	默认None
eval_group	验证集的分组数据	默认None
eval_metric	字符串，它应该是一个内置的评估指标。如果是可调用的，它应该是一个定制的评估指标，请参阅注释以了解更多细节	默认None
early_stopping_rounds	激活早期停止。该模型将进行训练，直到验证分数停止改进。为了继续训练，验证错误需要至少每轮减少一次	默认None
verbose	如果为True并且使用了评估集，则写入评估进度	默认True
feature_name	特征名称，如果‘ auto ‘和data是 DataFrame，则使用数据列名称	默认auto
categorical_feature	分类功能，如果是int的列表，则解释为下标。如果字符串列表，解释为特性名称(也需要指定feature_name)，如果‘ auto ‘和data是pandas DataFrame，则使用pandas分类列	默认auto
callbacks	在每次迭代中应用的回调函数列表	默认None

得到拟合模型的特征个数

获得模型拟合的具体目标

返回标签的所有分类（仅限于分类问题）

返回标签的类别数量

返回模型的最好分数

指定了early_stopping_rounds时拟合模型的最佳迭代

模型的提升方式

如果已指定early_stopping_rounds，则计算结果

返回每个特征的特征重要性

原文地址：https://www.cnblogs.com/weibaohang/p/14702783.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行