在无监督学习中,我们很少或者根本不知道结果是什么样子。我们可以根据数据中变量之间的关系对数据进行聚类,无监督学习没有基于预测结果的反馈。 例子: 聚类:收集1000000个不同的基因,并找到一种方法,自动将这些基因分成不同的变量组,如寿命、位置、角色等。非聚类:“鸡尾酒会算法”,让你在混乱的环境中找 ...
分类:
其他好文 时间:
2017-07-22 22:25:45
阅读次数:
112
关键参数 最重要的,常常需要调试以提高算法效果的有两个参数:numTrees,maxDepth。 numTrees(决策树的个数):增加决策树的个数会降低预测结果的方差,这样在测试时会有更高的accuracy。训练时间大致与numTrees呈线性增长关系。 maxDepth:是指森林中每一棵决策树最 ...
分类:
编程语言 时间:
2017-07-19 10:36:07
阅读次数:
181
面向对象: 相对于面向过程编程来讲,面向对象的扩展性比较强。但是同时带来的问题是可控性差,面向对象编程不像面向过程那样可以很精准的预测结果。面向对象程序一旦开始就由对象之间进行交互解决问题。 面向对象程序设计只是用来解决程序扩展性的。 什么是对象: 举一个例子:每个人都有自己特征和技能,那么每个人就 ...
分类:
编程语言 时间:
2017-06-29 22:16:26
阅读次数:
198
机器学习过程分为训练过程和预测过程。训练过程得到一个模型,预测过程得到预测结果。为了节省时间,最好能够在每次执行预测时,调用已经构造好的模型,而不是每次预测前都需要重新训练一次模型。 以“决策树”为例,最好能够在每次执行分类时调用已经构造好的决策树。可以使用Python中的pickle模块序列化对象 ...
分类:
编程语言 时间:
2017-05-11 18:34:27
阅读次数:
232
树的节点将要预测的空间划分为一系列简单域,划分预测空间的规则可以被建模为一棵树,所以这种方法也叫决策树方法。 bagging,随机森林,boosting 是多棵决策树组合起来采用投票方式产生一个预测结果的方法。 以树为基础的方法可以用于回归和分类。 回归树: 输出是一个实数,如房子的价格等。 回归树 ...
分类:
其他好文 时间:
2017-04-24 14:36:10
阅读次数:
146
随机森林模型是一种数据挖掘模型,常用于进行分类预测。随机森林模型包含多个树形分类器,预测结果由多个分类器投票得出。 决策树相当于一个大师,通过自己在数据集中学到的知识对于新的数据进行分类。俗话说得好,一个诸葛亮,玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠,希望最终的分类效果能够超过单个大师的一 ...
分类:
其他好文 时间:
2017-04-17 10:01:24
阅读次数:
637
1.11. Ensemble methods(集成学习) 目标: 相对于当个学习器,集成学习通过使用多个基学习器的预测结果来来提高学习预测的泛化性能以及鲁棒性; 集成学习的两个思路: 1)、通过使用并行的学习,得到多个学习模型然后取其平均结果目的在于减少方差,代表算法有随机森林。通常来说多个学习器的 ...
分类:
其他好文 时间:
2017-04-13 22:53:19
阅读次数:
801
注意:本随笔是在《C++Primer(第四版)习题解答(完整版)》中直接抄录的。此处主要是便于本人以后反复阅读。 习题1.8 指出下列输出语句那些(如果有)是合法的。 预测结果,然后编译包含上述三条语句的程序,检查你的答案。纠正所遇到的错误。 【解答】 第一条和第二条语句合法。 第三条语句中<< 操 ...
分类:
编程语言 时间:
2017-03-12 21:31:29
阅读次数:
192
一。多层的异常捕获 预测结果:ArrayIndexOutOfBoundsException/内层try-catch发生ArithmeticException 预测结果:ArrayIndexOutOfBoundsException/外层try-catch 二:异常抛出几点注意 1.异常时立刻跳出,寻找 ...
分类:
编程语言 时间:
2016-11-25 22:40:22
阅读次数:
240
分类器是数据挖掘中对样本进行分类的方法的统称,包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。 分类器的构造和实施步骤: 选定样本(正负样本),分成训练样本和测试样本两部分。 在训练样本上执行分类器算法,生成分类模型。 在测试样本上执行分类模型,生成预测结果。 根据预测结果,计算必要的评估指标,评 ...
分类:
其他好文 时间:
2016-10-26 13:58:07
阅读次数:
139