1.指定字符出现多次用 ([a-zA-Zxxx]+),不是 (a-zA-Zxxx)+,后面那个是这一组出现多次,对于贪婪模式来说可能有些问题 2.贪婪模式,最好后面跟着一个结束标识符 3..net默认使用的是Unicode匹配模式‘’ 4、 关于C#字符串中的\转义问题 与 正则表达式中的\的转义问 ...
贪心算法 贪心算法(又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。 贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只 ...
分类:
其他好文 时间:
2017-11-17 21:09:09
阅读次数:
193
1.贪婪算法的第二个应用为 哈夫曼编码 来进行文件压缩。 文件压缩的主要问题是给文件中的所有字符分配能唯一识别的编码(n个比特),如果我们事先知道所有字符出现的频率,把频率最高的放在最上层,频率低的放在左侧最下层,这就是最优编码。 2.编码树,所有字符都放在叶节点上,往左走的每条路径代表0,往右走的 ...
分类:
编程语言 时间:
2017-11-17 00:01:44
阅读次数:
269
文本处理工具:全屏编辑器:vim,nano行编辑器:文本处理三剑客:grep系列,sed,awkgrep系列:grep,egrep,fgrep;统称为文件搜索工具;基于PATTERN(模式)对于给定的文本文件进行模糊搜索,grep系列所有命令默认个左右贪婪工作模式;sed:streameditor,流编辑器,文本编辑工..
分类:
其他好文 时间:
2017-11-16 17:21:33
阅读次数:
164
*+?{} 李杰李莲李二 李杰和李莲英李二棍 注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配 字符集 [] [^] 李杰李莲英李二棍子 李杰李莲英李二棍子 4563 4563 分组()与或| [^] 身份证号码是一个长度为15或18个字符的字符串,如果是15位则全 ...
分类:
其他好文 时间:
2017-11-13 18:30:37
阅读次数:
153
字符: 量词: . ^ $ * + ? { } 李杰李莲李二 李杰和李莲英李二棍 注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配 字符集[][^] 李杰李莲英李二棍子 李杰李莲英李二棍子 4563 4563 分组 ()与 或 |[^] 身份证号码是一个长度为15或 ...
分类:
其他好文 时间:
2017-11-13 16:31:01
阅读次数:
237
假设待处理的字符串是 xfooxxxxxxfoo 模式.*foo (贪婪模式): 模式分为子模式p1(.*)和子模式p2(foo)两个部分. 其中p1中的量词匹配方式使用默认方式(贪婪型)。 匹配开始时,吃入所有字符xfooxxxxxx去匹配子模式p1。匹配成功,但这样以来就没有了字符串去匹配子模式 ...
分类:
编程语言 时间:
2017-11-11 13:15:14
阅读次数:
150
import reimport urllib.request#(http://\S*?)[\"] 提取不带"#http://\S*?[\"] 提取的时候带"#\S非空字符 *0-多个 ?非贪婪 \"|>|)三个符号其中之一为结束httpre=re.compile(r"(http://\S*?)[\" ...
分类:
编程语言 时间:
2017-11-08 00:56:03
阅读次数:
216
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。 注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever ...
分类:
编程语言 时间:
2017-11-04 20:51:45
阅读次数:
181