机器学习就是把无序的数据转换成有用的信息。
机器学习的主要任务就是分类,通过通过训练数据训练算法,最终可以将实际的数据分到合适的类别中
监督学习算法:预测目标变量的值
k-means算法,线性回归
朴素贝叶斯算法,局部加权线性回归
支持向量机,ridge回归
决策树,lasso最小回归系数估计
无监督学习算法:不需要预测目标变量的值
k-均值,最大期望算法
DBS...
分类:
其他好文 时间:
2014-08-22 14:28:59
阅读次数:
340
1. 基本方法设$X, Y$分别是定义在输入空间和输出空间上的随机变量。$P(X,Y)$是$X$和$Y$的联合概率分布。训练数据集\begin{equation}T = \{(x_1, y_1), (x_2, y_2),...,(x_n, y_n) \}\end{equation}由$P(X,Y)$...
分类:
其他好文 时间:
2014-08-22 08:10:05
阅读次数:
212
文本分类现已比较成熟,各类开源工具不少,现推荐几个比较常用简单的工具:1、scikit-learn:http://scikit-learn.org/stable/index.html python编写调用,里面有各种分类算法svm、随机森林、贝叶斯等,和特征提取,如字、ngram等,几行代码便可以构...
分类:
其他好文 时间:
2014-08-18 17:52:42
阅读次数:
193
这两天看了下朴素贝叶斯分类器,在这里根据自己的理解做个简单笔记,也顺便整理一下思路。 一、简介 1. 什么是朴素贝叶斯分类器? 朴素贝叶斯分类器是一种应用基于独立假设的贝叶斯定理的简单概率分类器。基于独立假设的意思是假设样本每个特征与其他特征都不相关,例如,一个物体具有颜色、大小、重量和材质等特征,...
分类:
其他好文 时间:
2014-08-17 14:16:12
阅读次数:
251
算法简单介绍NBC是应用最广的分类算法之中的一个。朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同一时候,NBC模型所需预计的參数非常少,对缺失数据不太敏感,算法也比較简单。算法如果给定目标值时属性之间互相条件独立。算法输入训练数据T={(x1,y1),(x2,y2),…...
分类:
其他好文 时间:
2014-08-16 22:26:21
阅读次数:
353
贝叶斯分类器 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:
其他好文 时间:
2014-08-16 13:48:00
阅读次数:
246
MALLET:基于Java语言的用于统计自然语言处理,文件分类,聚类,主题建模,信息提取,和其他的用于文本的机器学习应用的Java包。
MALLET包括复杂的用于文件分类的工具:
有效的用于转换文本到“特征”的程序,多种多样的算法(包括朴素贝叶斯,最大熵,和决策树)。以及一些通用的指标用于评估分类器性能。
除了分类,MALLET包括序列标注的工具,像从文本...
分类:
其他好文 时间:
2014-08-16 11:15:20
阅读次数:
256
条件概率、全概率公式与贝叶斯公式(转载)
一、背景
一个随机事件的概率,确切地说,是指在某些给定的条件下,事件发生的可能性大小的度量.但如果给定的条件发生变化之后,该事件的概率一般也随之变化.于是,人们自然提出:如果增加某个条件之后,事件的概率会怎样变化的?它与原来的概率之间有什么关系?显然这类现象是常有的.
[例1] 设有一群共人,其中个女性,个是色盲患者.
个色盲患者中女性占...
分类:
其他好文 时间:
2014-08-12 10:27:54
阅读次数:
383
经过了2个月对机器学习的了解后,我发现了,机器学习的方向多种多样。网页排序,语音识别,图像识别,推荐系统等。算法也多种多样。看见其他的书后,我发现除了讲到的k均值聚类,贝叶斯,神经网络,在线学习等等,还有很多其他的算法。比如说:免疫算法,遗传算法,主成分分析,蚁群算法等等。好像很多算法都是需要做很多的研究才能用的很好的。据说深度学习是由神经网络升级来的。神经网络本身就是一本书,内容很多。龙星计划里...
分类:
其他好文 时间:
2014-08-12 00:39:33
阅读次数:
206