KMP算法专门用于处理字符串匹配问题。 开始学习的时候觉得很有道理,但是一些细节总觉得有些模糊,所以一直觉得懵懵懂懂。今天思考了一下,总结一下,希望对大家也有帮助。 朴素的字符串匹配算法就是一个一个字符挨个去试,但是当匹配串长度比较长的时候复杂度显然会爆炸。 为了解决这个问题,很厉害的三个人想出来了 ...
分类:
其他好文 时间:
2019-04-09 00:50:13
阅读次数:
163
朴素贝叶斯是一个概率模型,在数学上能用概率解释的模型一般被认为是好模型。 朴素贝叶斯常用于文本分类。 先介绍几个基础概念。 1. 概率 设x为符合某种特征的样本,H为某个假设,比如假设x属于类别c,那分类就是求这个假设发生的概率,即P(H|x)的大小。 P(H|X)是后验概率,或者说在条件X下,H的 ...
分类:
其他好文 时间:
2019-04-06 09:21:09
阅读次数:
97
生成式模型 P(X,Y)对联合概率进行建模,从统计的角度表示数据的分布情况,刻画数据是如何生成的,收敛速度快。 ? 1. 判别式分析 ? 2. 朴素贝叶斯Native Bayes ? 3. 混合高斯型Gaussians ? 4. K近邻KNN ? 5. 隐马尔科夫模型HMM ? 6. 贝叶斯网络 ? ...
分类:
其他好文 时间:
2019-04-05 18:12:33
阅读次数:
211
稀疏矩阵的存储是(行,列,数值)的形式,做转置的意义是保持排列顺序(即行顺序下保持列顺序)。需要注意的是,计算机只存储三维数组表 Array[terms],而不存储其他0数字。 朴素算法是,从上到下扫描列数=k的项直到总列数Col,由于原表行号已经保持顺序,所以输出的新表里行数=k,列数顺序。复杂度 ...
分类:
其他好文 时间:
2019-04-04 20:24:24
阅读次数:
167
1.自动文本分类是对大量的非结构化的文字信息(文本文档、网页等)按照给定的分类体系,根据文字信息内容分到指定的类别中去,是一种有指导的学习过程。 分类过程采用基于统计的方法和向量空间模型可以对常见的文本网页信息进行分类,分类的准确率可以达到85%以上。分类速度50篇/秒。 2.要想分类必须先分词,进 ...
分类:
其他好文 时间:
2019-03-24 23:06:57
阅读次数:
197
这个小段的内容主要是朴素贝叶斯、支持向量机、决策树和集成学习的代码,看不懂..........后面的更是看不懂.................. 朴素贝叶斯: scikit-learn提供了伯努利,多项式,高斯三个变体。伯努利是一个二项分布,多项式是离散分布,高斯是连续分布。用在不同的场景里: 伯 ...
分类:
编程语言 时间:
2019-03-23 17:30:40
阅读次数:
185
朴素算法,即不对子串进行预处理。 利用朴素算法我们可以在主串中寻找子串出现的次数。 代码一: 代码二: 定义两个指针p,q;p指向主串首地址,q指向子串首地址。 如果对应的字符相等,那么++p,++q,即两个指针都向后移一个单位再继续比较*p和*q, 否则q回到子串的首地址,只把指针p向后移动一个单 ...
分类:
编程语言 时间:
2019-03-22 22:45:44
阅读次数:
197
二分图简介 二分图是一种图论模型,其特点在于可以将图内的点分进两个集合,而每个集合内部的点没有直接关联,常用的二分图模型有二分图匹配 二分图最大匹配 1. 几种实现方法 1. 匈牙利算法 2.最大流算法(此处是ISAP) 2. 简单应用 1. 朴素的匹配问题 这一类问题的就是将一个实际问题转化为用一 ...
分类:
其他好文 时间:
2019-03-20 19:13:56
阅读次数:
152
本文主要简单写写自己学习FFT的经历以及一些自己的理解和想法。 FFT的介绍以及入门就不赘述了,网上有许多相关的资料,入门的话推荐这篇博客:FFT(最详细最通俗的入门手册) 为什么要学习FFT呢?因为FFT能将多项式乘法的时间复杂度由朴素的$O(n^2)$降到$O(nlogn)$,这相当于能将任意形 ...
分类:
其他好文 时间:
2019-03-13 20:13:29
阅读次数:
174
机器学习的几大类: 1.推荐 2.分类 3.聚类 4.回归 5.用户画像 6.深度学习 7.人工神经网络 8.关联分析 分类算法: 1.朴素贝叶斯 2.决策树 3.随机森林 4.支持向量机(SVM) 5.隐马尔可夫模型 6.遗传算法 分类属于有监督的学习过程,可以根据经验或者数学推导等辅助的方法给机 ...
分类:
其他好文 时间:
2019-03-10 20:57:00
阅读次数:
226