搜索关键字：findall，搜索到707个结果！码迷,mamicode.com！

机器学习-贝叶斯拼写纠正器实战

#python版本3.7 import re, collections #将语料库里的单词全部转换为小写def words(text): return re.findall('[a-z]+', text.lower()) #词频统计def train(features): model = colle ...

分类：其他好文时间：2018-12-20 22:14:53 阅读次数：227

吴裕雄 python 爬虫（1）

from urllib.parse import urlparse url = 'http://www.pm25x.com/city/beijing.htm' o = urlparse(url) print(o) print("scheme={}".format(o.scheme)) # http ... ...

分类：编程语言时间：2018-12-20 17:02:43 阅读次数：209

re模块与正则表达式

首先要先继承re模块: import re re.findall() 方法 # 返回值为列表 \w 表示一个字符,为数字,字母,下滑线之一, \W匹配任意非数字,字母,下划线 print(re.findall('\w3\w','abc3dafg375983_')) # 输出结果为: ['c3d', ...

分类：其他好文时间：2018-12-19 22:06:29 阅读次数：164

Python 正则

Match 对象的属性 .string 待匹配的文本 .re 匹配是使用的pattern对象（正则表达式） .pos 正则表达式搜索文本的开始位置 .endpos 正则表达式搜索文本的结束位置 Match 对象的方法 .group() 获得匹配后的字符串 .start() 匹配字符中的原始字符串的开 ...

分类：编程语言时间：2018-12-16 18:13:59 阅读次数：237

python常用模块——re

re 正则匹配模块一、元字符： . 通配符，匹配任意一个字符(\n除外) ^ 开头 $ 结尾 * 重复匹配，重复前面的字符0个或多个；特殊情况： import re ret = re.findall('7*','efe') print(ret) # 输出['', '', '', ''] 因为*可 ...

分类：编程语言时间：2018-12-09 19:59:21 阅读次数：231

爬虫2

今天杭州市是真的冷，还没来得及感受秋天，冬天突然来了，有点措手不及。这篇把剩下的写完。找到要爬取分组的url，我用了正则表达式，re库里的findall()方法，好处是返回是一个list，缺点是返回的list中可能有重复。 list去重是一个很简单，但是可能在各公司面试时比较常见的一个问题。下 ...

分类：其他好文时间：2018-12-08 22:27:33 阅读次数：132

简单爬虫例子

import re from urllib.request import urlopen def getPage(url): response = urlopen(url) return response.read().decode('utf-8') def parsePage(s): ret = ... ...

分类：其他好文时间：2018-12-08 22:26:07 阅读次数：192

计算文本中大写字母的个数findall

findall(r"^",b),findall("$",b),findall("[a z]",b) ...

分类：其他好文时间：2018-12-02 16:19:10 阅读次数：185

re模块

注意： 1 findall的优先级查询： 2 split的优先级查询 ...

分类：其他好文时间：2018-11-26 22:03:50 阅读次数：227

Python之re模块

re模块下的常用方法注意： 1、findall的优先级查询 2、split的优先级查询 ...

分类：编程语言时间：2018-11-24 14:11:09 阅读次数：174

共707条上一页 1 ... 23 24 25 26 27 ... 71 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)