机器学习的几大类: 1.推荐 2.分类 3.聚类 4.回归 5.用户画像 6.深度学习 7.人工神经网络 8.关联分析 分类算法: 1.朴素贝叶斯 2.决策树 3.随机森林 4.支持向量机(SVM) 5.隐马尔可夫模型 6.遗传算法 分类属于有监督的学习过程,可以根据经验或者数学推导等辅助的方法给机 ...
分类:
其他好文 时间:
2019-03-10 20:57:00
阅读次数:
226
[TOC] 参考资料 "随机森林" 随机森林 在随机森林中,我们将生成很多的决策树CART。当在基于某些属性对一个新的对象进行分类判别时,随机森林中的每一棵树都会给出自己的分类选择,并由此进行“投票”,森林整体的输出结果将会是票数最多的分类选项;而在回归问题中,随机森林的输出将会是所有决策树输出的平 ...
分类:
其他好文 时间:
2019-03-10 20:34:14
阅读次数:
159
分类算法:对目标值进行分类的算法 1、sklearn转换器和预估器 2、KNN算法 3、模型选择与调优 4、朴素贝叶斯算法 5、决策树 6、随机森林 sklearn转换器(transfer)与估计器(estimeter) 1、转换器 - 特征工程的父类 转换器 - 特征工程的父类 1、API的实现过... ...
分类:
编程语言 时间:
2019-03-10 12:23:56
阅读次数:
627
恢复内容开始 随机森林算法梳理 1. 集成学习概念 通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统、基于委员会的学习等 2. 个体学习器概念 通常由一个现有的算法从训练数据产生的基学习器。 3. boosting bagging boosting: 是一族可将弱学习器提升为强学习器 ...
分类:
编程语言 时间:
2019-02-28 22:42:54
阅读次数:
281
集成学习: 集成学习在机器学习算法中具有较高的准去率,不足之处就是模型的训练过程可能比较复杂,效率不是很高。 目前接触较多的集成学习主要有2种:基于Boosting的和基于Bagging,前者的代表算法有Adaboost、GBDT、XGBOOST、后者的代表算法主要是随机森林。 集成学习主要思想: ...
分类:
其他好文 时间:
2019-02-27 20:36:53
阅读次数:
221
Handle Imbalanced Classes In Random Forest Preliminaries # Load libraries from sklearn.ensemble import RandomForestClassifier import numpy as np from ...
分类:
其他好文 时间:
2019-02-27 10:24:53
阅读次数:
1012
随机森林的特征重要性原理 随机森林的特征重要性原理 随机森林的特征重要性原理 随机森林的特征重要性原理 1、随机森林得到的feature importance的原理? 在随机森林中某个特征X的重要性的计算方法如下: 1:对于随机森林中的每一颗决策树,使用相应的OOB(袋外数据)数据来计算它的袋外数据 ...
分类:
其他好文 时间:
2019-02-25 23:32:33
阅读次数:
1069
如果大家想学人工智能的话,那么就一定不能够忽视有关机器学习的内容。这时候就会有人问,什么是机器学习?所谓机器学习就是一门多领域交叉学科,涉及概率论、统计学、逼近论等多门学科。机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的一门... ...
分类:
其他好文 时间:
2019-02-20 17:23:37
阅读次数:
170
在这个案例中: 1. datetime.datetime.strptime(data, '%Y-%m-%d') # 由字符串格式转换为日期格式 2. pd.get_dummies(features) # 将数据中的文字标签转换为one-hot编码形式,增加了特征的列数 3. rf.feature_i ...
分类:
其他好文 时间:
2019-01-23 23:19:50
阅读次数:
2750
概述:本节讲述Arcgis for Js加载ArcgisServer和GeoServer发布的wms服务。 1、定义resourceInfo var resourceInfo = { extent: new Extent(-126.40869140625,31.025390625,-109.6655 ...
分类:
Web程序 时间:
2019-01-18 10:18:47
阅读次数:
663