1. Naive Bayes算法 朴素贝叶斯算法算是生成模型中一个最经典的分类算法之一了,常用的有Bernoulli和Multinomial两种。在文本分类上经常会用到这两种方法。在词袋模型中,对于一篇文档$d$中出现的词$w_0,w_1,...,w_n$, 这篇文章被分类为$c$的概率为$$p(c ...
分类:
编程语言 时间:
2017-07-26 23:33:33
阅读次数:
399
https://wenku.baidu.com/view/6950c49d866fb84ae45c8daa 1- 2- 3- 4- 5- ...
分类:
其他好文 时间:
2017-06-29 20:36:28
阅读次数:
90
https://wenku.baidu.com/view/6370f28d26fff705cc170aab.html 1- 2- 3- 4- 5- 6- 7- 8- 9- 10- 11- 每幅图像的每一个特征点与哪个中心特征点最近,这个中心特征点就加1 12- 最后,在一大堆直方图中,测试新来的图像 ...
分类:
其他好文 时间:
2017-06-29 19:22:32
阅读次数:
127
1.公有函数: 构造函数:出入进来一帧,该帧作为关键帧,传入地图,关键帧的集合。 根据给的量设置公有变量,和获得公有量。 计算词袋,mBowVec,mFeatVec。上一篇讲过了,只是注意mFeatVec指定了层数。 当前帧与传入的pKF(输入)有共视的时候,增加连接关系。weight(输入)。表示 ...
分类:
其他好文 时间:
2017-06-08 23:36:21
阅读次数:
962
前言 上篇我们介绍了HMM的基本原理以及常见的基于参数的异常检测实现,这次我们换个思路,把机器当一个刚入行的白帽子,我们训练他学会XSS的攻击语法,然后再让机器从访问日志中寻找符合攻击语法的疑似攻击日志。 通过词法分割,可以把攻击载荷序列化成观察序列,举例如下: 词集/词袋模型 词集和词袋模型是机器 ...
分类:
编程语言 时间:
2017-05-15 10:11:05
阅读次数:
291
一. 贝叶斯公式推导 朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素是因为其思想基础的简单性:就文本分类而言,它认为词袋中的两两词之间的关系是相互独立的,即一个对象 的特征向量中每个维度都是相互独立的。例如,黄色是苹果和梨共有的属性,但苹果 和梨是相互独立的。这是朴素贝叶斯理论的思想基础。现在我们 ...
分类:
编程语言 时间:
2017-05-05 18:25:59
阅读次数:
595
LDA理解以及源码分析(一) http://blog.csdn.net/pirage/article/details/50239125 LDA在主题建模中的应用,需要知道以下几点: 文档集中的words不考虑顺序,符合Bag Of Word词袋模型,假设总词汇数为V。 每篇由n个word生成的doc ...
分类:
其他好文 时间:
2017-03-09 15:22:27
阅读次数:
343
原博文地址:http://www.cnblogs.com/nobadfish/articles/5244637.html 原论文名叫Byeond bags of features:Spatial Pyramid Matching for Recognizing Natural Scene Categ ...
分类:
其他好文 时间:
2016-08-05 13:42:47
阅读次数:
164
需要准备的知识点:http://www.cnblogs.com/zjiaxing/p/5616653.html http://www.cnblogs.com/zjiaxing/p/5616664.html http://www.cnblogs.com/zjiaxing/p/5616670.html ...
分类:
数据库 时间:
2016-06-25 19:13:44
阅读次数:
2590
当我们尝试使用统计机器学习方法解决文本的有关问题时,第一个需要的解决的问题是,如果在计算机中表示出一个文本样本。一种经典而且被广泛运用的文本表示方法,即向量空间模型(VSM),俗称“词袋模型”。 我们首先看一下向量空间模型如何表示一个文本: 空间向量模型需要一个“字典”:文本的样本集中特征词集合,这 ...
分类:
其他好文 时间:
2016-06-10 13:36:34
阅读次数:
456