朴素贝叶斯本次课程大纲:1、朴素贝叶斯-朴素贝叶斯事件模型2、神经网络(简要)3、支撑向量机(SVM)铺垫–最大间隔分类器复习:1、朴素贝叶斯一种生成学习算法,对p(x|y)建模。例:垃圾邮件分类以邮件输入流作为输入,输出y为{0,1},1为垃圾邮件,0为非垃圾邮件。将邮件文本表示为一个输入向量x1...
分类:
其他好文 时间:
2015-04-11 14:37:54
阅读次数:
385
那几年,我学习机器学习的主要内容:
1.机器学习基本导论,机器学习入门了解;
2.线性回归与Logistic。xx业绩预测系统,智能交互统计系统等;
3.岭回归,Lasso,变量选择技术。维度的技巧等技术;
4.降维技术。xx指标设计,具体规范;
5.线性分类器,Knn算法,朴素贝叶斯分类器,文本挖掘。XX智能垃圾消息,垃圾邮件判断,评论智能分析,智能监控统计预警系统呀。
6.决策树,组合提升算...
分类:
其他好文 时间:
2015-03-20 14:27:55
阅读次数:
168
决策树、knn算法都是结果确定的分类算法,数据示实例最终被明确的划分到某个分类中贝叶斯:不能完全确定数据实例应该划分到某个类,湖综合只能给出数据实例属于给定分类的概率 *引入先验概率与逻辑推理来处理不确定命题 *(扩展命题),另一种叫频数概率,从数据本身出发得到结论,不考了逻辑推理及先验知识。朴.....
分类:
其他好文 时间:
2015-03-19 06:12:50
阅读次数:
155
一、朴素贝叶斯(Naïve Bayes)分类器 1.1 公式 朴素贝叶斯是一个概率分类器 文档 d 属于类别 c 的概率计算如下(多项式模型): nd是文档的长度(词条的个数) P(tk |c) 是词项tk 出现在类别c中文档的概率,即类别c文档的一元语言模型 P(tk |c) 度量的是当c是正确类...
分类:
编程语言 时间:
2015-03-07 18:23:06
阅读次数:
657
朴素贝叶斯算法是寻找一个极大后验假设(MAP),即候选假设的最大后验概率。
如下:
在朴素贝叶斯分类器中,假设样本特征之间是独立的,则有:
计算每个假设的后验概率,选出最大的概率,对应的类别就是样本的分类结果。
优缺点:
对小规模的数据表现很好,适合多分类任务,适合增量式训练。当时,需要样本的特征之间独立性较高,不能有太多的相关性。对输入数据的表达形式很敏...
分类:
编程语言 时间:
2015-03-02 11:19:44
阅读次数:
297
宅在家无聊之余决定看着《概率论和数理统计》&《统计学习方法》总结一下朴素贝叶斯和贝叶斯估计。
正好这一块我最近温习了一下,我从一开始条件概率开始写,把我所理解的贝叶斯分类算法完整呈现一下吧。
学的概率论最开始是在高中,当时是条件概率,给出条件概率的定义:事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为P(A|B),读作“在B条件下A的概率”。
其次...
分类:
其他好文 时间:
2015-02-12 09:25:16
阅读次数:
229
1.朴素贝叶斯概率模型的数学实质:独立条件概率。 朴素在这里的含义就是各影响因子概率发生独立。2.朴素贝叶斯分类器的数学模型:条件概率模型P(C|F1F2...Fn)=P(C)P(F1F2...Fn|C)/P(F1F2...Fn) (1)这里Fn代表的是独立变量C的若干个特征变量(影响因子)。我们知...
分类:
其他好文 时间:
2015-02-11 18:08:30
阅读次数:
204
朴素贝叶斯分类器是用来做分类的一个简便方法。在贝叶斯公式的基础上,引人条件独立的假设,使得贝叶斯分类器具有简单易行的优点和假设时常与实际不符的缺点。下面简单介绍一下朴素贝叶斯分类器。 首先规定一下数据格式:输入的每一个样本为${{x}^{i}},{{c}^{i}}$,其中:$i$为样本编号,$...
分类:
其他好文 时间:
2015-02-06 21:40:19
阅读次数:
147
朴素贝叶斯(Normal Bayes)适用于离散型特征的分类问题。相比于KNN的纯暴力,决策树的降维以求减少比较次数的优化,NB的优势在于,训练完成之后,分类测试的效率非常高。设样本数为n,分类数据为mKNN没有训练过程,需要分类的时候,即时确定分类。总复杂度O(mn^2)决策树虽然有训练过程,但是...
分类:
其他好文 时间:
2015-02-02 01:54:16
阅读次数:
229