下面以一个网站的图书爬取为例,数据需要记录大分类 、小分类等信息。 页面有 大分类页面、小分类页面、列表页面、详情页面、 需要一条数据,包括所有的信息,所以借助meta的作用来把当前响应的数据进行传递给下一个解析函数。 为什么需要深拷贝呢?防止一条数据还没有收集完全,就被下一个请求重新定义item给 ...
分类:
Web程序 时间:
2019-01-14 20:17:25
阅读次数:
164
1, 过滤字符串中的英文与符号,保留汉字 2, 从字符串中提取字母 result = ''.join(re.findall(r'[A-Za-z]', str)) ...
分类:
其他好文 时间:
2019-01-11 23:24:40
阅读次数:
298
1. 正则 正则就是用一些具有特殊意义的符号组合到一起(正则表达式)来描述字符或者字符串的方法,在python中正则匹配时通过re模块来实现的 2. re模块 单个字符匹配 重复匹配 分组 3. 常用方法 findall 全部找到并返回一个列表 # 结果['https://pic3.zhimg.co ...
分类:
编程语言 时间:
2019-01-11 22:17:00
阅读次数:
244
python中的re模块常用函数/方法 0.正则表达式对象 (re.compile(pattern, flags=0)) 将正则表达式编译成正则表达式对象,该对象可调用正则表达式对象方法如:re.match(),re.search(),re.findall等。 1.匹配对象及方法 (Match.gr ...
分类:
编程语言 时间:
2019-01-05 00:15:12
阅读次数:
230
正则表达式(匹配字符串)web界面正则匹配工具:http://tool.chinaz.com/regex/元字符 re的功能是在python中执行正则表达式re模块下的常用方法import rere.findall 正则 待匹配字符串,列表,所有符合的项re.search 变量.group取结果,只 ...
分类:
编程语言 时间:
2018-12-30 17:34:11
阅读次数:
185
def judge_password(password): if len(password) >= 8: pattern = re.compile('[A-Z]+') match = pattern.findall(password) if match: pattern = re.compile('... ...
分类:
其他好文 时间:
2018-12-30 02:35:18
阅读次数:
241
re模块 正则表达式就是字符串的匹配规则,在多数编程语言里都有相应的支持,python里对应的模块是re 常用的表达式规则 re的匹配语法有以下几种 re.match 从头开始匹配 re.search 匹配包含 re.findall 把所有匹配到的字符放到以列表中的元素返回 re.split 以匹配 ...
分类:
其他好文 时间:
2018-12-29 18:38:17
阅读次数:
202
一. 正则表达式 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表达式由普通字符和元字符组成, 普通字符包含大小写字母, 数字. 在 ...
分类:
编程语言 时间:
2018-12-29 16:01:39
阅读次数:
182
正则表达式(匹配字符串)web界面正则匹配工具:http://tool.chinaz.com/regex/元字符 re的功能是在python中执行正则表达式re模块下的常用方法import rere.findall 正则 待匹配字符串,列表,所有符合的项re.search 变量.group取结果,只 ...
分类:
编程语言 时间:
2018-12-28 22:14:16
阅读次数:
214
# re的工作是在python中执行正则表达式 import re # # find # result = re.findall("\d+", "baby的电话号是: 185123456789") # print(result) # # it = re.finditer("\d+", "baby12... ...
分类:
其他好文 时间:
2018-12-28 21:14:28
阅读次数:
210