1. 例子引入:如上篇的play or not 例子。未知分类的样本:D:, 是 or 否?我们要判断该样本的分类,即比较该样本属于是的概率大还是否的概率大 P(是/否|A=sunny, B=cool, C=high ,D=strong)P(是|A=sunny, B=cool, C=high ,D=...
                            
                            
                                分类:
编程语言   时间:
2014-10-12 22:01:08   
                                阅读次数:
488
                             
                         
                    
                        
                            
                            
                                概率分布(Distributions)如图1所看到的,这是最简单的联合分布案例,姑且称之为学生模型。图1当中包括3个变量,各自是:I(学生智力,有0和1两个状态)、D(试卷难度,有0和1两个状态)、G(成绩等级,有1、2、3三个状态)。表中就是概率的联合分布了,表中随便去掉全部包括某个值的行,就能对...
                            
                            
                                分类:
其他好文   时间:
2014-10-12 17:14:48   
                                阅读次数:
278
                             
                         
                    
                        
                            
                            
                                1 定位背景介绍 一说到定位大家都会想到gps,然而gps定位有首次定位缓慢(具体可以参考之前的博文《LBS定位技术》)、室内不能使用、耗电等缺陷,这些缺陷大大限制了gps的使用。在大多数移动互联网应用例如google地图、百度地图等,往往基于wifi、基站来进行定位。 一般APP在请求定位的...
                            
                            
                                分类:
编程语言   时间:
2014-10-12 13:49:48   
                                阅读次数:
307
                             
                         
                    
                        
                            
                            
                                朴素贝叶斯python实现 ,实例学习朴素贝叶斯分类方法。...
                            
                            
                                分类:
编程语言   时间:
2014-10-11 00:29:04   
                                阅读次数:
628
                             
                         
                    
                        
                            
                            
                                乔丹教授(Michael I. Jordan)教授是机器学习领域神经网络的大牛,他对深度学习、神经网络有着很浓厚的兴趣。因此,很多提问的问题中包含了机器学习领域的各类模型,乔丹教授对此一一做了解释和展望。首先被提到的就是经典的贝叶斯非参数模型。今年暑假,乔丹教授在Como开设了贝叶斯非参数模型的课程...
                            
                            
                                分类:
其他好文   时间:
2014-10-10 13:52:04   
                                阅读次数:
169
                             
                         
                    
                        
                            
                            
                                贝叶斯公式描述的是一组条件概率之间相互转化的关系。
在机器学习中,贝叶斯公式可以应用在分类问题上。这篇文章是基于自己的学习所整理,并利用一个垃圾邮件分类的例子来加深对于理论的理解。
这里我们来解释一下朴素这个词的含义:
1)各个特征是相互独立的,各个特征出现与其出现的顺序无关;
2)各个特征地位同等重要;
以上都是比较强的假设
下面是朴素贝叶斯分类的流程:...
                            
                            
                                分类:
其他好文   时间:
2014-10-09 21:39:17   
                                阅读次数:
205
                             
                         
                    
                        
                            
                            
                                这两天学习了一个相对比较简单但是十分实用的分类算法——贝叶斯分类算法,与我做项目使用的svm算法相比确实有很多精妙之处,。好比撒尿牛丸——好吃又好玩,而贝叶斯分类器则是简单又强大。本文结合简单天气预报进行讲解。
贝叶斯定理:
贝叶斯定理是概率论里面一个计算条件概率的法器!为什么是法器,且看后文。先摆出计算公式:
也许乍一看这公式没什么,但是我们先将公式移项得:P(A|B)P(B)=P...
                            
                            
                                分类:
其他好文   时间:
2014-10-09 16:31:18   
                                阅读次数:
274
                             
                         
                    
                        
                            
                            
                                考虑用机器学习建立一个邮件过滤系统,来将邮件分成垃圾邮件和非垃圾邮件。首先我们建立一个词典,里面包含了邮件中所有的不重复单词。我们用长度为词典中单词数目的特征向量来表示一封邮件。如下所示:表示一封邮件,如果该邮件包含有词典中的第i个单词,那么,否则.为了建模,作一个很强的假设,假设词典中的每个单词是...
                            
                            
                                分类:
其他好文   时间:
2014-10-08 01:25:54   
                                阅读次数:
385
                             
                         
                    
                        
                            
                            
                                共轭分布是一种极大简化贝叶斯分析的方法。其作用是有两个:1.简化贝叶斯公式中概率函数的计算;2.在贝叶斯公式包含多种概率分布的情况下,使这些分布的未知参数在试验前被赋予的物理意义,延续到试验后,便于分析。第二个作用尤为重要。...
                            
                            
                                分类:
其他好文   时间:
2014-10-06 10:19:30   
                                阅读次数:
162
                             
                         
                    
                        
                            
                            
                                安装package: > install.packages("e1071") 导入e1071: > library(e1071) 找一个数据集: > data(iris)
> iris
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1            5.1         ...
                            
                            
                                分类:
其他好文   时间:
2014-10-05 01:15:57   
                                阅读次数:
262