字符串的匹配的算法一直都是比较基础的算法,我们本科数据结构就学过了严蔚敏的KMP算法。KMP算法应该是最高效的一种算法,但是确实稍微有点难理解。所以打算,开这个博客,一步步的介绍4种匹配的算法。也是《算法导论》上提到的。我会把提到的四种算法全部用c/c++语言实现。提供参考学习。下图的表格,介绍.....
分类:
编程语言 时间:
2015-09-03 00:43:13
阅读次数:
261
1102. Strange Dialog
Time Limit: 1.0 second
Memory Limit: 16 MB
One entity named "one" tells with his friend "puton" and their conversation is interesting. "One" can say words "out" and "output...
分类:
编程语言 时间:
2015-08-04 08:14:23
阅读次数:
230
一个源程序运行得到结果一般都要经过编译和执行的过程,C语言的编译和执行过程如下:
编译的过程:
编译的功能是将人们能看懂的高级语言,转换成计算机能看懂的二进制语言,可以分为下面的六个阶段:
词法分析阶段:根据语言的词法规则来进行分析,词法的规则可用正规文法或正规式来表示是指有限自动机能识别正规文法的语言和正规式组成的集合。
语法分析阶段:在词法分析的基础上将单词分别分解成各类语法单位,它依据语言...
分类:
编程语言 时间:
2015-07-16 11:55:41
阅读次数:
189
/**
*考虑一个C语言的程式,由标准输入流一行一行的读取资料,打印各一行的第一个英文单字。
*因此一开始需确认第一个英文单字之前是否有空白,若有,需读取所有空白后略过不打印,读取第一个英文单字然后打印,之后读取其他内容略过不打印,直到读到换行符号为止。
*任何情形下只要读到换行符号,就重新开始此算法,任何情形下只要读到档案结束(end-of-file)的符号,就结束程式。
*/
p...
分类:
其他好文 时间:
2015-06-06 22:09:33
阅读次数:
145
后缀自动机是一种确定性有限自动机(DFA),它可以且仅可以匹配一个给定串的任意后缀。构造一个可以接受一个给定串的所有后缀的不确定性有限自动机(NFA)是很容易的,我们发现我们用通用的将NFA转换成对应DFA的算法转换出来的DFA的状态数都很小(O(n)级别的,远远达不到指数级别)。于是,人们就开始研...
分类:
其他好文 时间:
2015-05-22 00:01:39
阅读次数:
182
正则表达式是一种不确定有限自动机。NFA。
在书写正则表达式时应尽量减少回溯来提高正则表达式的效率。
一. 理解元字符
根据功能,元字符可分为两种类型:匹配位置的元字符和匹配字符的元字符。
1. 匹配位置的元字符
包括:^、$和\b三个字符。
^(脱字符号,在文章插入字时使用)
$(美元符号)。
他们分别表示行的开始和末尾。
^string 正则表达式匹配以str...
分类:
其他好文 时间:
2015-04-14 16:41:38
阅读次数:
141
字符串匹配指有一个文本串S和一个模式串P,现在要查找P在S中的位置。
主要有以下算法:
其中朴素算法和KMP算法我们在这边blog
http://blog.csdn.net/lu597203933/article/details/41124815中已经讲解过。RP算法时间复杂度较高,我也没看,想看可以看算法导论。这里主要讲解有限自动机的字符串匹配算法。
有限自动机的定义:...
分类:
编程语言 时间:
2015-03-13 20:48:27
阅读次数:
158
序最近在看自然语言处理方面的书籍,也写写相关的读书笔记吧
英语单词拼写是文字录入,编辑,出版等工作中的一项重要任务。实现单词拼写检测的方法很多,我这里就暂时写2个,第一个是在《统计自然语言处理》书中的 K.Oflazer用有限自动机写的,第二个是在网上看见的一个20几行python代码写的《How to Write a Spelling Corrector》自动机法基于优先自动机的识别器,可以看成...
分类:
其他好文 时间:
2015-03-10 12:06:40
阅读次数:
511
很多KMP的文章,写得在我看来不够通俗,更不要说从有限自动机来去理解了,本文,从有限自动机,从KMP的根源带你深入了解KMP算法!
分类:
编程语言 时间:
2015-02-04 21:40:13
阅读次数:
277
花了一天写出的程序没有顾及很多层面,但对于理解基本的实验道理和交上实验还是有点帮助的。代码实现了基于有限自动机的词法分析,采用递归下降分析法和EBNF文法实现语法分析并生成中间代码。...
分类:
其他好文 时间:
2014-12-03 21:34:50
阅读次数:
279