朴素贝叶斯(Naive Bayes)及Python实现 http://www.cnblogs.com/sumai 1.模型 在GDA 中,我们要求特征向量 x 是连续实数向量。如果 x 是离散值的话,可以考虑采用朴素贝叶斯的分类方法。 以垃圾邮件分类为例子,采用最简单的特征描述方法,首先找一部英语词
分类:
编程语言 时间:
2016-03-10 01:29:11
阅读次数:
370
本篇blog是利用Python进行文章特征提取的续篇,主要介绍构建带TF-IDF权重的文章特征向量。 In [1]: # 带TF-IDF权重的扩展词库 # 在第一篇文档里 主要是利用词库模型简单判断单词是否在文档中出现。然而与单词的顺序、频率无关。然后词的频率对文档更有意义。因此本文将词频加入特征向
分类:
编程语言 时间:
2016-02-27 19:22:40
阅读次数:
252
一套矩阵库,主要实现功能有求特征值&特征向量,求合同标准型。 定义了实矩阵,多项式,多项式矩阵,向量四个类 注释比较详尽 /* Copyright © 2016 by dhd All Right Reserved. */ #include<bits/stdc++.h> #define rep(i,
分类:
其他好文 时间:
2016-02-14 22:09:27
阅读次数:
255
原文:http://www.cnblogs.com/leonwen/p/5158947.html 该算法由MatLab移植而来(具体参见上一篇博文)。但是最终输出结果却和MatLab不一致,经排查发现在进行调用两者内部函数eig进行求解特征值和特征向量的时候,两者特征值都一致,但是特征向量却不...
分类:
编程语言 时间:
2016-01-26 00:08:41
阅读次数:
322
斯坦福ML公开课笔记15我们在上一篇笔记中讲到了PCA(主成分分析)。PCA是一种直接的降维方法。通过求解特征值与特征向量,并选取特征值较大的一些特征向量来达到降维的效果。本文继续PCA的话题,包含PCA的一个应用——LSI(Latent Semantic Indexing, 隐含语义索引)和PCA...
分类:
其他好文 时间:
2016-01-24 16:50:21
阅读次数:
197
最近在做目标追踪的过程中用到了2DPCA变换,花了两天时间研究了下2DPCA的起源及其重要改进,在此稍作总结。 1、一维PCA及其不足之处 在介绍2DPCA之前,稍微提一下历史悠久的PCA变换,一句话总结PCA变换:“通过求解目标协方差矩阵的前N个最大特征值对应的特征向量来组成特征映射矩阵以...
分类:
其他好文 时间:
2015-11-19 22:27:43
阅读次数:
146
感知机,就是二类分类的线性分类模型,其输入为样本的特征向量,输出为样本的类别,取+1和-1二值,即通过某样本的特征,就可以准确判断该样本属于哪一类。顾名思义,感知机能够解决的问题首先要求特征空间是线性可分的,再者是二类分类,即将样本分为{+1, -1}两类。http://www.cnblogs.co...
分类:
其他好文 时间:
2015-10-26 22:18:09
阅读次数:
186
《数字图像处理与计算机视觉》第十一章模式识别是指对表征事物或现象的各种形式的信息进行处理和分析,对事物或者现象进行描述,辨认,分类和解释的过程。模式识别方法分类:1.统计模式识别:有相似的样本在模式空间中互相接近,形成集团。器分析方法是根据模式所测得的特征向量。在这里,贝叶斯决策规则从理论上解决了最...
分类:
其他好文 时间:
2015-10-21 22:37:54
阅读次数:
182
一、基本概念 基本的矩阵分解方法通过学习用户和物品的特征向量进行预测,即用户和物品的交互信息。用户的特征向量代表了用户的兴趣,物品的特征向量代表了物品的特点,且每一个维度相互对应,两个向量的内积表示用户对该物品的喜好程度。但是我们观测到的评分数据大部分都是都是和用户或物品无关的因素产生的效果,即有....
分类:
其他好文 时间:
2015-10-12 18:43:32
阅读次数:
1452
推荐系统是现今广泛运用的一种数据分析方法。常见的如,“你关注的人也关注他”,“喜欢这个物品的用户还喜欢。。”“你也许会喜欢”等等。常见的推荐系统分为基于内容的推荐与基于历史记录的推荐。基于内容的推荐,关键在于提取到有用的用户,物品信息,以此为特征向量来进行分类,回归。基于历史记录的推荐,记录用户的评...
分类:
其他好文 时间:
2015-10-09 16:48:54
阅读次数:
327