正则表达式 1.1其中常用的有: 1.2matches()方法 matches() 方法用于检测字符串是否匹配给定的正则表达式。 ...
                            
                            
                                分类:
其他好文   时间:
2018-11-08 22:13:03   
                                阅读次数:
196
                             
                         
                    
                        
                            
                            
                                    正则表达式有: 贪婪模式 和 非贪婪模式 例如: '<div>[\s\S]*</div>' 为贪婪模式 ; 找距离<div> 最远的那个 </div> '<div>[\s\S]*?</div>' 为非贪婪模式 ;找距离<div> 最近的那个 </div> 常用的跨行匹配就是: (\s|\S)* 与  ...
                            
                            
                                分类:
其他好文   时间:
2018-11-02 00:25:13   
                                阅读次数:
176
                             
                         
                    
                        
                            
                            
                                    基本字符匹配 \s 空白符 \w 字母或下划线 \d 任意数字 ^ 匹配一行字符串开头 $ 匹配一行字符串的结尾 \ 匹配0个或多个表达式 \+ 匹配一个或多个表达式 . 匹配任意字符(除换行符) ? 非贪婪匹配方式 a|b 匹配a或b () 子表达式 {} 匹配个数 re模块 mathch 从头开 ...
                            
                            
                                分类:
编程语言   时间:
2018-10-31 12:39:43   
                                阅读次数:
196
                             
                         
                    
                        
                            
                            
                                    今天分享正则表达式最后一个特殊字符“\d”,具体的教程如下。 1、特殊字符“\d”十分常用,其代表的意思是数字。代码演示如下图所示。 其中“+”的意思是表示连续,在这里代表的意思是连续的数字。但是输出只有“4”这个字符,原因是贪婪模式所致,在上一篇文章中也有提及。 2、如果想要匹配“2004”,则需 ...
                            
                            
                                分类:
编程语言   时间:
2018-10-27 11:55:46   
                                阅读次数:
231
                             
                         
                    
                        
                            
                            
                                    贪婪匹配:当正则表达式中包含能接受到重复的限定符时,通常的行为是匹配尽可能多的字符,这中匹配方式叫做贪婪匹配。特征是一次性读入整个字符串经行匹配,每当不匹配就舍弃最右边一个字符,继续匹配,依次匹配和舍弃,直到匹配成功或者把整个字符串舍弃为止,因此它是一种最大化数据返回,能多不会少。 前面我们讲过重复 ...
                            
                            
                                分类:
其他好文   时间:
2018-10-20 23:43:40   
                                阅读次数:
165
                             
                         
                    
                        
                            
                            
                                linux用户及其组管理,bash管道,grep正则,以及基础文件的管理等的综合运用示例。
                            
                            
                                分类:
系统相关   时间:
2018-10-12 14:52:27   
                                阅读次数:
189
                             
                         
                    
                        
                            
                            
                                    '''' This is a module ''' import re from urllib import request # 断点调试 class Spider(): ''' This is a class ''' # 私有方法 # 匹配所有字符 [\s\S]*? 非贪婪 url='https:... ...
                            
                            
                                分类:
其他好文   时间:
2018-09-17 17:44:41   
                                阅读次数:
165
                             
                         
                    
                        
                            
                            
                                正则模块:re
import re
print(re.findall(‘\w‘,‘egon 123 + _ - *‘))  #\w匹配字母数据及下划线
print(re.findall(‘\W‘,‘egon 123 + _ - *‘))  #\W匹配非字母数据及下划线
print(re.findall(‘\s‘,‘egon\t 12\n3 + _ - *‘))  #\s匹配任意空白字符,等价于[\f\n\r\t]
print(re.findall(‘\S‘,‘egon 123 + _ - *‘))   #\S匹配任意非空字符
print(re.findall(‘\d‘,‘egon\t 12\n3 + _ - *‘)) #\d匹配任意数字,等价于[0-9]
print(re.findall(‘\D‘,‘egon\t 12\n3 + _ - *‘)) #\D匹配任意非数字
print(re.findall(‘\A‘,‘egon\t 12\n3 + _ - *‘)) #匹配字符串开始
print(re.findall(‘\n‘,‘egon\t 12\n3 + _ - *‘))
                            
                            
                                分类:
其他好文   时间:
2018-09-11 01:05:04   
                                阅读次数:
187
                             
                         
                    
                        
                            
                            
                                    cuiqingcai大佬《Python3 网络爬虫开发实战》整理 贪婪与非贪婪 原本打算取出12345678,但 运行结果:8 贪婪匹配模式:.* 会匹配尽可能多的字符。 .*后(\d+)至少匹配一个数字,未指定具体数字。因此,.*尽可能匹配多的字符,把1234567匹配,给\d+留下一个仅满足条件 ...
                            
                            
                                分类:
编程语言   时间:
2018-09-02 17:18:23   
                                阅读次数:
180
                             
                         
                    
                        
                            
                            
                                #Tips:# help('keywords') # 查看所有的关键字# 一、正则表达式的概念# 概念:对特殊的字符做过滤、验证# 二、re模块import re# re.findall() # 在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表# re.se... ...
                            
                            
                                分类:
其他好文   时间:
2018-08-31 10:49:16   
                                阅读次数:
245