\w 匹配一个字母、数字或下划线字符,相当于[a-zA-Z_0-9]\s 匹配一个空字符\d 匹配一个数字\b 匹配单词的首尾^、$是以行为单位进行锁定位置,而\b是以单词为单位进行锁定位置这些修饰符的大写形式为它们匹配的相反情况。这样我们要匹配连续的字符串可以用 \w+ 匹配一个单词用 \b\w....
分类:
其他好文 时间:
2014-08-06 18:20:41
阅读次数:
230
通配符多用在文件名上,比如查找find,ls,cp等。正则表达式用在文本过滤工具里,比如grep,awk,sed等。一、通配符*可以和零个或多个任意字符匹配? 与任何单个字符匹配二、正则表达式正则表达式中的特殊字符比较多,以下仅列举一些:. 匹配任何单个字符$ 匹配行结束符^ 匹配一行的开...
分类:
其他好文 时间:
2014-08-06 17:20:11
阅读次数:
251
Trie树,又称字符查找树、前缀树,主要用于字符匹配(详见http://en.wikipedia.org/wiki/Trie)。适合做关键词查找,比如查找文章中的关键字然后给他们加链接。 当然对脏词的过滤应用也是样,只是把替换连接的工作换成了替换字符。当前的代码还只是进行简单的替换,并没有做一些字符...
分类:
其他好文 时间:
2014-08-04 14:07:57
阅读次数:
270
大规模数据采集后总是要进行数据匹配,这个时候正则表达式就能十分酷炫的解决这个问题~常用的元字符代码 说明. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d 匹配数字\b 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束例子 一个网站如果要求你填写的...
分类:
其他好文 时间:
2014-08-01 04:39:51
阅读次数:
304
在此保存下近段时间做的DP在字符匹配上的实现的题目对于不同的字符串来说,2者只能不断将下标往后推移来实现匹配从而得到的最大匹配数如 abcd 和 dcba 这个最大匹配数只能为1,因为两个d匹配后,在第一个字符串中是不能再拿前面的字符进行匹配的(当然你要是匹配a,b,c也是一样的道理)对于每一道题目...
分类:
其他好文 时间:
2014-07-31 20:06:17
阅读次数:
235
/** * 假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置 如果j = -1,或者当前字符匹配成功(即S[i] == * P[j]),都令i++,j++,继续匹配下一个字符; 如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = * next[j]...
分类:
编程语言 时间:
2014-07-31 16:28:46
阅读次数:
255
?匹配任意一个字符,*匹配任务多个字符(包括0)#include #include int match(const char *src, const char *pattern){ if (src == NULL || pattern == NULL) { return 0...
分类:
其他好文 时间:
2014-07-30 11:34:53
阅读次数:
193
字符 说明 \ 将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,“n”匹配字符“n”。“\n”匹配换行符。序列“\\”匹配“\”,“\(”匹配“(”。 ^ 匹配输入字符串开始的位置。如果设置了?RegEx...
分类:
其他好文 时间:
2014-07-26 03:36:57
阅读次数:
240
1、正则表达式分析日志提取信息字符匹配:普通字符:大多数字符和字母一般都会和自身匹配如正则表达式test会和字符串‘test’完成匹配元字符:.^$*+?{}[]\|()re模块findall用法:用法1:s=‘helloworld‘p=‘hello‘re.findall(p,s)用法2:s=‘helloworld‘r=re.compile(r‘hello‘)r.f..
分类:
编程语言 时间:
2014-07-21 19:35:02
阅读次数:
257
暴力搜索 用字符匹配,直至符合或者超出范围 1 #include 2 #include 3 #include 4 #include 5 using namespace std; //不加的话queue的声明无法通过 6 int n,c; 7 int visit[5001];//标记余...
分类:
其他好文 时间:
2014-07-19 11:20:17
阅读次数:
205