标签:范围 中文字符 入侵 匹配 正则表达式 ali 分组 ip地址 取值
一、正则表达式在文本处理中的常用:
1.表达文本类型的特征(病毒、入侵等)
2.同时查找或替换一组字符串
3.匹配字符串的全部或部分(主要)
二、正则表达式的常用操作符
| 操作符 | 说明 | 
| . | 表示任何单个字符 | 
| [] | 给定单个字符的取值范围 | 
| [^] | 限定字符的取值不能是括号里的字符 | 
| * | 前一个字符扩展0次或者无限次 | 
| + | 前一个字符扩展1次或无限次 | 
| ? | 前一个字符扩展0次或者1次 | 
| | | 左右表达式中的任意一个 | 
| {m} | 前一个字符扩展m次 | 
| {m,n} | 前一个字符扩展m至n次 | 
| ^ | 不在[]里的^表示匹配字符串的开头 | 
| $ | 与^相反,匹配一个字符串的结尾 | 
| () | 分组标记,在括号内部只能使用|操作符 | 
| \d | 数字,等价于[0-9] | 
| \w | 单词字符,等价于[A-Za-z0-9_] | 
三、经典正则表达式实例
| ^[A-Za-z]+$ | 由26个字母组成的字符串 | 
| ^[A-Za-z0-9]+$ | 由26个字母和数字组成的字符串 | 
| ^-?\d+$ | 整数形式的字符串 | 
| ^[0-9]*[1-9][0-9]*$<=>^[1-9][0-9]*$ | 正整数形式的字符串(^\d+$) | 
| [1-9]\d{5} | 中国境内邮政编码,6位(^\d{6}$错误),不是字符串 | 
| [\u4e00-\u9fa5] | 匹配中文字符串 | 
| \d{3}-\d{8}|\d{4}-\d{7} | 国内电话号码,010-68913536(^\d{3}-\d{8}$错误) | 
| (([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5]).){3} ([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5]) | IP地址符(IP地址分4段,每段是0-255) | 
标签:范围 中文字符 入侵 匹配 正则表达式 ali 分组 ip地址 取值
原文地址:https://www.cnblogs.com/BASE64/p/10309500.html