码迷,mamicode.com
首页 > 其他好文 > 详细

正则表达式总结

时间:2017-07-12 01:07:47      阅读:255      评论:0      收藏:0      [点我收藏+]

标签:方法   visible   大小写   lan   tom   replace   总结   match   tab   

正则表达式总结

正则表达式的语法里面分为字符、预定义字符、数量词、边界匹配、逻辑分组、特殊构造,如图:

技术分享

先介绍Python中支持正则表达式的re模块中的方法,使用什么函数都大同小异,重要的是正则表达式。

函数描述
compile(pattern)返回一个匹配完模式的对象
search(pattern, string)在字符串中搜索模式
match(pattern, string)从字符串开始匹配模式
split(pattern, string)根据模式来分隔字符串
findall(pattern, string)在字符串中找出所有匹配模式的
sub(pattern, replace, string)在字符串中找出所有匹配模式的并且用replace来替换
escape(string)特殊字符转义

比如说邮箱,我们分析它的结构,其是一个前面为字符和数字组成,中间一个@,跟着字符和数字,后面是.com组成。所以简单的来写就是(\w+)*@(\w+)*\.com,考虑到如果字符和数字中间可能会允许-或者.的存在,所以可以写为\w+([-+.]\w+)*@\w+([-.]\w+)*\.com

所以我们可以这么写代码:

import re
ma = re.search(‘\w+([-+.]\w+)*@\w+([-.]\w+)*\.com‘, ‘aq1#$125vqr&qqw.eq+we2@qq.comsadasd‘)
print(ma.group())  # qqw.eq+we2@qq.com

下面给出一些特定情况下使用的正则表达式例子。

  1. 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8-10 之间):

    ^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
  2. 汉字:

    [\u4e00-\u9fa5]{0,}$
  3. IP地址

    \d+\.\d+\.\d+\.\d+
  4. 日期格式

    ^\d{4}-\d{1,2}-\d{1,2}
  5. 密码(以字母开头,长度在 6~18 之间,只能包含字母、数字和下划线)

    ^[a-zA-Z]\w{5,17}$

当然还有很多,大家在匹配的时候具体问题具体分析,参考前面提到的那种图片。

参考文章【个人总结】正则表达式语法及常用正则

正则表达式总结

标签:方法   visible   大小写   lan   tom   replace   总结   match   tab   

原文地址:http://www.cnblogs.com/George1994/p/7153101.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!