码迷,mamicode.com
首页 >  
搜索关键字:findall    ( 707个结果
机器学习-贝叶斯拼写纠正器实战
#python版本3.7 import re, collections #将语料库里的单词全部转换为小写def words(text): return re.findall('[a-z]+', text.lower()) #词频统计def train(features): model = colle ...
分类:其他好文   时间:2018-12-20 22:14:53    阅读次数:227
吴裕雄 python 爬虫(1)
from urllib.parse import urlparse url = 'http://www.pm25x.com/city/beijing.htm' o = urlparse(url) print(o) print("scheme={}".format(o.scheme)) # http ... ...
分类:编程语言   时间:2018-12-20 17:02:43    阅读次数:209
re模块与正则表达式
首先要先继承re模块: import re re.findall() 方法 # 返回值为列表 \w 表示一个字符,为数字,字母,下滑线之一, \W匹配任意非数字,字母,下划线 print(re.findall('\w3\w','abc3dafg375983_')) # 输出结果为: ['c3d', ...
分类:其他好文   时间:2018-12-19 22:06:29    阅读次数:164
Python 正则
Match 对象的属性 .string 待匹配的文本 .re 匹配是使用的pattern对象(正则表达式) .pos 正则表达式搜索文本的开始位置 .endpos 正则表达式搜索文本的结束位置 Match 对象的方法 .group() 获得匹配后的字符串 .start() 匹配字符中的原始字符串的开 ...
分类:编程语言   时间:2018-12-16 18:13:59    阅读次数:237
python常用模块——re
re 正则匹配模块 一、元字符: . 通配符,匹配任意一个字符(\n除外) ^ 开头 $ 结尾 * 重复匹配,重复前面的字符0个或多个; 特殊情况: import re ret = re.findall('7*','efe') print(ret) # 输出['', '', '', ''] 因为*可 ...
分类:编程语言   时间:2018-12-09 19:59:21    阅读次数:231
爬虫2
今天杭州市是真的冷,还没来得及感受秋天,冬天突然来了,有点措手不及。 这篇把剩下的写完。 找到要爬取分组的url,我用了正则表达式,re库里的findall()方法,好处是返回是一个list,缺点是返回的list中可能有重复。 list去重是一个很简单,但是可能在各公司面试时比较常见的一个问题。 下 ...
分类:其他好文   时间:2018-12-08 22:27:33    阅读次数:132
简单爬虫例子
import re from urllib.request import urlopen def getPage(url): response = urlopen(url) return response.read().decode('utf-8') def parsePage(s): ret = ... ...
分类:其他好文   时间:2018-12-08 22:26:07    阅读次数:192
计算文本中大写字母的个数findall
findall(r"^",b),findall("$",b),findall("[a z]",b) ...
分类:其他好文   时间:2018-12-02 16:19:10    阅读次数:185
re模块
注意: 1 findall的优先级查询: 2 split的优先级查询 ...
分类:其他好文   时间:2018-11-26 22:03:50    阅读次数:227
Python之re模块
re模块下的常用方法 注意: 1、findall的优先级查询 2、split的优先级查询 ...
分类:编程语言   时间:2018-11-24 14:11:09    阅读次数:174
707条   上一页 1 ... 23 24 25 26 27 ... 71 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!