参考博客:http://www.crifan.com/python_re_search_vs_re_findall/
在这里,我想说一下我目前遇到的问题
这是一个本地的文件 text.txt
极客学院爬虫测试
欢迎参加《Python定向爬虫入门课程》
这是第一条
这是第二条
...
分类:
编程语言 时间:
2015-07-26 19:18:16
阅读次数:
147
(?!...)向前识别不等于指定字符就匹配,当下一个单词不等于...时就识别出来括号前面指定的单词。比如Isaac(?!Asimov),就会这样判断,当紧跟着Isaac后面不是单词Asimov时,就把它匹配出来。例子:print('Isaac(?!Asimov)')print(u'abcdAsimovIsaacttttt')m = re.findall(u'Isaac(?!Asimov)', u'...
分类:
其他好文 时间:
2015-07-26 11:15:40
阅读次数:
163
(?...)这个语法规则是前面的扩展,主要在问号位置可以替换为特定的字符。例子:print('(?...)')m = re.findall(r'(a...)', r'abcdefaghijk')if m: print(m) 输出结果如下:(?...)['abcd', 'aghi'](?#...)括号内容注释掉,不起作用。在正则表达式分析时,跳过这些规则。例子:print('(?#a)')m ...
分类:
其他好文 时间:
2015-07-25 10:41:25
阅读次数:
208
compile编译后执行速度更快,findall返回匹配列表>>>importre>>>r=r‘a[bcd]e‘>>>p=re.compile(r)>>>printp.findall(‘abe,ace,ade,afe‘)[‘abe‘,‘ace‘,‘ade‘]>>>printre.findall(r,‘abe,ace,ade,afe‘)[‘abe‘,‘ace‘,‘ade‘]>>&..
分类:
编程语言 时间:
2015-07-20 17:07:38
阅读次数:
230
特别字符集:‘.’点号,在缺省的情况下,可以用来代替任何除换行符之外的字符;如果DOTALL标志设置了,它可以用来代替任何字符,包括换行符。例子:#re import re m = re.findall('a.', 'ab a2 bb a+')if m: print(m)结果输出如下:['ab', 'a2', 'a+']在这个例子里,先使用import语句导入正则表达式库re,然后使用函数f...
分类:
其他好文 时间:
2015-07-18 09:36:15
阅读次数:
189
#1字符匹配importrer=r‘ab‘printre.findall(r,‘abcdefgabcd‘)#2如果有元字符,注意使用转义符‘\‘r=r‘1\*2‘printre.findall(r,‘01*234501*2345‘)#元字符介绍#3^匹配行首r=r‘^123‘printre.findall(r,‘1234512345‘)#4$匹配行尾r=r‘345$‘printre.findall(r,‘1234512345‘)#5.匹配单..
分类:
编程语言 时间:
2015-07-17 07:12:02
阅读次数:
212
import repage=20f=open('test','r')html=f.read()f.close()#取得标题title=re.search('(.*?)',html,re.S).group(1)print title#取得链接地址like=re.findall("href='(.*?)...
分类:
编程语言 时间:
2015-07-16 18:41:08
阅读次数:
186
注释 ctrl+shift+c格式化代码 ctrl+shift+f撤销操作 ctrl+z/y自动导包 ctrl+shift+o快速在相关类中添加方法 例如 service.findALL() ,在service类中使用ctrl+1就能在该类中添加了findALL方法 ctrl+1查看源代...
分类:
系统相关 时间:
2015-07-16 09:34:49
阅读次数:
154
1、简单的正则表达式import res=r'abc're.findall(s,"aaaaaaaaaaaaaaa") #结果为[]re.findall(s,"abcaaaaaaaaaaaa") #结果为['abc']re.findall(s,"abcaaaaaabcaaaa") #结...
分类:
编程语言 时间:
2015-06-22 21:59:37
阅读次数:
148
一、常用方法findall:匹配所有符合规律的内容,返回包含结果的列表search:匹配并提取第一个符合规律的内容,返回一个正则表达式对象(Object)sub:替换符合规律的内容,返回替换后的值。S:表示多行匹配注意:findall与search的区别:findall会遍历整个加载范围里的内容,并...
分类:
编程语言 时间:
2015-06-20 15:38:50
阅读次数:
268