例子:分类:play or not ?(是/否) 目的:根据训练样本集S构建出一个决策树,然后未知分类样本通过决策树就得出分类。问题:怎么构建决策树,从哪个节点开始(选择划分属性的问题)方法:ID3(信息增益),C4.5(信息增益率),它们都是用来衡量给定属性区分训练样例的能力。1. 为了理解信息....
分类:
编程语言 时间:
2014-10-11 16:33:06
阅读次数:
256
基于item的推荐是常用并且高效的一种推荐方式,最重要的是它可以做实事推荐。...
分类:
编程语言 时间:
2014-10-11 14:41:25
阅读次数:
337
朴素贝叶斯python实现 ,实例学习朴素贝叶斯分类方法。...
分类:
编程语言 时间:
2014-10-11 00:29:04
阅读次数:
628
网上介绍K-近邻算法的例子很多,其Python实现版本基本都是来自于机器学习的入门书籍《机器学习实战》,虽然K-近邻算法本身很简单,但很多初学者对其Python版本的源代码理解不够,所以本文将对其源代码进行分析。
什么是K-近邻算法?
简单的说,K-近邻算法采用不同特征值之间的距离方法进行分类。所以它是一个分类算法。
优点:无数据输入假定,对异常值不敏感
缺点:复杂度高
...
分类:
编程语言 时间:
2014-10-10 23:56:14
阅读次数:
326
原文:http://blog.sciencenet.cn/blog-714246-812365.html本文主要是对机器视觉以及与其密切相关的机器学习,模式识别等领域的研究团队做一个的汇总。网上目前流传最广的几个版本中有很多链接已经失效,同时许多新的研究小组没有加入,因此对最新信息的一个聚合应当会十...
分类:
其他好文 时间:
2014-10-10 19:29:54
阅读次数:
546
前言本篇文章主要是继续前几篇Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,算法介绍后,经过这几种算法综合挖掘和分析之后,对一份摆在公司面前的人员信息列表进行推测,挖掘出这些人员信息中可能购买自行车的群体,把他们交个营销部,剩下的事...
分类:
数据库 时间:
2014-10-10 19:13:44
阅读次数:
219
机器学习的入门书籍《机器学习实战》使用的语言是python。下面介绍利用Python开始“机器学习”的准备工作。(环境:CentOS 7)
1, 两个重要的包
NumPy 和 SciPy。(http://scipy.org/scipylib/download.html )主要是处理数值运算,矩阵操作等。
注:Sci是Science的缩写。
官网介绍了安装方法,可以手动安装,也可以使...
分类:
编程语言 时间:
2014-10-10 18:20:44
阅读次数:
232
乔丹教授(Michael I. Jordan)教授是机器学习领域神经网络的大牛,他对深度学习、神经网络有着很浓厚的兴趣。因此,很多提问的问题中包含了机器学习领域的各类模型,乔丹教授对此一一做了解释和展望。首先被提到的就是经典的贝叶斯非参数模型。今年暑假,乔丹教授在Como开设了贝叶斯非参数模型的课程...
分类:
其他好文 时间:
2014-10-10 13:52:04
阅读次数:
169
贝叶斯公式描述的是一组条件概率之间相互转化的关系。
在机器学习中,贝叶斯公式可以应用在分类问题上。这篇文章是基于自己的学习所整理,并利用一个垃圾邮件分类的例子来加深对于理论的理解。
这里我们来解释一下朴素这个词的含义:
1)各个特征是相互独立的,各个特征出现与其出现的顺序无关;
2)各个特征地位同等重要;
以上都是比较强的假设
下面是朴素贝叶斯分类的流程:...
分类:
其他好文 时间:
2014-10-09 21:39:17
阅读次数:
205