OJ升级,代码可能会丢失. 所以要事先备份. 一开始傻傻的复制粘贴, 后来实在不能忍, 得益于大潇的启发和聪神的原始代码, 网页爬虫走起!
已经有段时间没看Python, 这次网页爬虫的原始代码是 python2.7版本, 试了一下修改到3.0版本, 要做很多包的更替,感觉比较烦,所以索性就在这个2.7版本上完善了.
首先观赏一下原始代码,我给加了一些注释:
# -*-...
分类:
编程语言 时间:
2014-05-15 02:39:45
阅读次数:
439
Regular Expression Matching,正则表达式...
分类:
其他好文 时间:
2014-05-15 02:35:05
阅读次数:
241
Regular Expression Special Characters
"."---Any single character(a "wildcard")
"["---Begin character class
"]"---End character class
"{"---Begin count
"}"---End count
"("---Begin grouping
")"...
分类:
其他好文 时间:
2014-05-15 01:41:09
阅读次数:
548
\b-元字符,代表单词的开头或结尾,也就是单词的分界处。 \bHi\b 下列未进行说明的都是元字符。.
匹配除了换行符以外的任意字符。 * 指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配。(不包含换行的字符) \bHi\b.*\bLucy\b\d
匹配一位数字(0或1或2..........
分类:
其他好文 时间:
2014-05-14 23:22:04
阅读次数:
283
题意:最大连续子序列和,在一个数组中找到和最大的连续子数组
思路:dp, 对于第i个数,有两种选择:把它加入在子数组里,不加入子数组(子数组到此结束)
加不加入子数组,要比较它加入前后子数组的总和是变大了还是变小了,如果变大则加入,变小则不加入
所以,我们需要记录以i-1结尾的子数组的总和,最后的结果在这些总和中取最大的那个
f[i] = max(f[i-1]+a[i],f[i-1]);
max({f[i]})
实现时用两个变量,一个保存f[i-1],一个保存目前为止最大的f[i]
复杂度:时间O(n),空...
分类:
其他好文 时间:
2014-05-14 21:53:14
阅读次数:
250
为Python添加默认模块搜索路径
方法一:函数添加
1) import sys
2) 查看sys.path
3) 添加sys.path.append("c:\\")
方法二:修改环境变量
windows用户可以修改系统环境变量PYTHONPATH
方法三:增加.pth文件,推荐!
在site-packages添加一个路径文件,如mypkpath.pth,必须以...
分类:
编程语言 时间:
2014-05-14 21:21:27
阅读次数:
419
正整数或一位小数或者俩位小数的正则表达式的写法
^(?!0+(?:\.0+)?$)(?:[1-9]\d*|0)(?:\.\d{1,2})?$...
分类:
Web程序 时间:
2014-05-14 19:18:16
阅读次数:
438
-------android培训、java培训、期待与您交流!----------正则表达式:符合一定规则的表达式。作用:用于专门操作字符串。特点:用一些特定的符合来表示一些代码操作,这样就简化书写。所以学习正则表达式,就是在学习一些特殊符号的使用。好处:可以简化对字符串的复杂操作。..
分类:
其他好文 时间:
2014-05-14 18:50:33
阅读次数:
358
grep命令可以从文本中或者通过管道送过来的字符流中或一个"-"符号代替文件名来搜索精确或者模糊的匹配信息,grep家族有三个命令:grep,egrep,fgrep。grep支持正则表达式匹配查找egrep支持扩展正则表达式匹配查找fgrep不支持正则表达式匹配查找grep命令的格式:grep[OPT]‘PATTERN‘F..
分类:
系统相关 时间:
2014-05-14 17:24:27
阅读次数:
428
上一篇文章总结了一些grep基本用法。在这次的内容里介绍grep和正则表达式结合使用的方法。首先介绍下正则表达式,正则表达式非基本和扩展两种。名词释义:正则表达式:正则表达式其实就是描述某些复杂规则字符串的代码集合。元字符:在正则表达式中具有特殊意义的专用字符正则..
分类:
其他好文 时间:
2014-05-14 15:52:01
阅读次数:
244