python中的re模块是正则技术中应用。对于正则就是正则表达式,正则表达式是独立一门技术,在各个编程体系都有它的“身影"。在python中在爬虫技术中,数据分析,它都是必不可少的存在。主要利用正则表达式筛选字符串中我们需要的字符串类型数据。 正则表达式基础知识。元字符和量词。 元字符 匹配作用 . ...
分类:
编程语言 时间:
2019-07-17 16:48:53
阅读次数:
109
元字符 重复限定符 分组 转义 条件或 区间 正则表达式在几乎所有语言中都可以使用,无论是前端的JavaScript、还是后端的Java、c#。他们都提供相应的接口/函数支持正则表达式。 但很神奇的是:无论你大学选择哪一门计算机语言,都没有关于正则表达式的课程给你修,在你学会正则之前,你只能看着那些 ...
分类:
其他好文 时间:
2019-07-16 10:30:31
阅读次数:
105
一. 定界符 -- // 二. 元字符 -- [] 其有三种应用,具体如下: 三. 转义 \d [0-9] \w [a-z0-9_] . 任意字符 \D [^0-9] \W [^a-z0-9_] \S 非空白 四. 量词--数量 {n} /a{6}/ /\d{11}/ {n,m} /\d{5,12} ...
分类:
其他好文 时间:
2019-07-15 01:18:11
阅读次数:
87
linux sed命令就是这么简单 阅读目录 概述 sed命令的选项 删除行 新增行 替换行 替换部分字符串而不是整行 搜索并输出行内容 将修改应用到文件中 sed正则中的元字符 阅读目录 概述 sed命令的选项 删除行 新增行 替换行 替换部分字符串而不是整行 搜索并输出行内容 将修改应用到文件中 ...
分类:
系统相关 时间:
2019-07-11 17:24:38
阅读次数:
121
自己学习的一些思路: 组成: 正则表达式由一些普通字符和一些元字符(metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义。 目的: 1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”): 2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。 ...
分类:
其他好文 时间:
2019-07-09 22:30:09
阅读次数:
113
一、正则表达式 注: 1、通用原子: \d : 数字, \D : 除了数字 \w : 数字,字母,下划线。 \W : 除了数字,字母,下划线。 \s : 空白符 , \S : 除了空白符 2、元字符: . :除了换行以外的所有字符 * : 匹配前面的内容出现 0 次及以上。 ? : 匹配前面的内容出 ...
分类:
Web程序 时间:
2019-06-28 00:23:57
阅读次数:
161
1.正则表达式:普通字符和元字符(特殊字符)组成的【模式】2.特殊字符: 【.】匹配除 "\n" 之外的任何单个字符。 要匹配包括 '\n' 在内的任何字符,请使用象 '[.\n]' 的模式。 【\w】匹配包括下划线的任何单个单词字符。等价于'[A-Za-z0-9_]'。 【\W】匹配任何单个非单词 ...
分类:
其他好文 时间:
2019-06-26 19:12:10
阅读次数:
129
grep: Global search regular expression and print out the line.
作用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文件逐行进行匹配检查,打印匹配的行
模式:由正则表达式的元字符及文本字符所编写出的过滤条件
grep [OPTIONS] PATTERN [FILE…]
OPTIONS:
--color=auto:对匹配到的文本着色后高亮显示
-i, --ignore-case:忽略字符的大小写
-o, --only-matching:仅显示匹配到的字符串本身
-v, --invert-match:显示不能被模式匹配到的行
-E, --extended-regexp:支持使用扩展的正则表达式元字符
-q, --quiet, --silent:静默模式,即不输出任何信息
-A #:after,显示匹配到行和向后#行
-B #:before,显示匹配到行和前#行
-C #:context,
分类:
系统相关 时间:
2019-06-24 09:25:23
阅读次数:
145
正则表达式基础以及Java中使用正则查找 定义: 正则表达式是一些用来匹配和处理文本的字符串 正则的基础(先大致了解下) 1. 正则表达式的作用 1. 查找特定的信息(搜索) 2. 替换一些文本(替换) 2. 正则基础知识 1. 元字符 . 匹配除换行符(\n)以外的任何单个字符 w 匹配字母、数字 ...
分类:
编程语言 时间:
2019-06-21 22:34:52
阅读次数:
154
sed命令和正则表达式sed是一种在线的,非交互式的编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,成为模式空间,接着用sed命令处理缓冲区的内容。处理完,把缓冲区的内容送往屏幕。sed支持正则表达式与grep一样,sed在文件中查找模式时也可以使用正则表达式(RE)和各种元字符。正则表达式是括在斜杠间的模式,>用于查找和替换,以下是sed支持的元字符使用基本元字符集^
分类:
其他好文 时间:
2019-06-21 17:09:28
阅读次数:
96