1 # -*- coding: utf-8 -*- 2 import xgboost as xgb 3 import csv 4 import jieba 5 jieba.load_userdict('wordDict.txt') 6 import numpy as np 7 from sklear... ...
分类:
其他好文 时间:
2018-09-08 22:37:30
阅读次数:
624
xgboost 基本概念Given dataseta tree ensemble model uses K additive functions to predict the outputwhere, 是CART的集合优化目标其中,为正则项when train the model in additi... ...
分类:
其他好文 时间:
2018-09-03 02:23:53
阅读次数:
178
观点1:XGBoost要比深度学习更重要。2016年Kaggle大赛29个获奖方案中,17个用了XGBoost。因为它好用,在很多情况下都更为可靠、灵活,而且准确;在绝大多数的回归和分类问题上,XGBoost的实际表现都是顶尖的。 观点2:针对非常要求准确度的那些问题,XGBoost确实很有优势,同 ...
分类:
其他好文 时间:
2018-08-28 11:24:47
阅读次数:
246
传统的GBDT是以CART作为基分类器,xgboost还支持线性分类器,这个时候XGBOOST相当于带L1和L2正则化的逻辑斯蒂回归(分类问题)或者线性回归(回归问题)。传统的GBDT在优化的hih只用到一阶导数信息,xgboost则对代价函数进行了二阶泰勒展开,同时用到了一阶和二阶导数。顺便提一下 ...
分类:
其他好文 时间:
2018-08-27 11:27:56
阅读次数:
188
1.输出XGBoost特征的重要性from matplotlib import pyplotpyplot.bar(range(len(model_XGB.feature_importances_)), model_XGB.feature_importances_)pyplot.show()XGBoo... ...
分类:
其他好文 时间:
2018-08-26 12:03:22
阅读次数:
1442
任务 放电时长预测,属于回归问题 数据集 从已经标注的样本库中取出10000条放电完全的曲线,70%为训练集,30%为测试集 特征及标签 对每一个样本,随机选取大于46.5V的点作为曲线最后一个点,该点到46.5V的时长即为预测时长 算法 BP,Linear Regression,Logistic ...
分类:
其他好文 时间:
2018-08-26 11:49:13
阅读次数:
175
1. xgboost在目标函数中加入了正则化项,当正则化项为0时与传统的GDBT的目标函数相同2. xgboost在迭代优化的时候使用了目标函数的泰勒展开的二阶近似,paper中说能加快优化的过程!!xgboost可自定义目标函数,但是目标函数必须二阶可导也是因为这个。GDBT中只用了一阶导数。3. ...
分类:
其他好文 时间:
2018-08-24 20:43:35
阅读次数:
254
# -*- coding: utf-8 -*- """ ############################################################################### # 作者:wanglei5205 # 邮箱:wanglei5205@126.com ... ...
分类:
其他好文 时间:
2018-08-22 21:47:26
阅读次数:
3562
http://blog.itpub.net/31542119/viewspace-2199549/ XGBoost是boosting算法的其中一种。Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。因为XGBoost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的 ...
分类:
其他好文 时间:
2018-08-11 12:28:08
阅读次数:
158
python核心库和统计 1. NumPy 2. SciPy 3. Pandas 4. StatsModels 可视化 5. Matplotlib 6. Seaborn 7. Plotly 8. Bokeh 9. Pydot 机器学习 10. Scikit-learn 11. XGBoost / L ...
分类:
编程语言 时间:
2018-08-06 23:17:51
阅读次数:
228