码迷,mamicode.com
首页 > 其他好文 > 详细

文本搜索必学命令-grep用法以及正则表达式

时间:2015-06-15 16:43:52      阅读:124      评论:0      收藏:0      [点我收藏+]

标签:表达式   单引号   双引号   字符串   linux   

Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。

语法格式:

grep  [option]........ ‘PATTERN‘ FILE..

(1)grep搜索字符串 [filename]
(2)grep正则表达式 [filename]

在文件中搜索所有 pattern 出现的位置, pattern 既可以是要搜索的字符串,也可以是一个正则表达式.

注意:在输入要搜索的字符串时最好使用双引号/而在模式匹配使用正则表达式时,注意使用单引号

命令选项:

  -v:反向选取

  -o:仅显示配的字串,而非字串所在的行

  -i:innore-case,忽略字符大小写

  -E:支持使用扩展正则表达式

   -A:显示匹配到字符那行的后面n行 

   -B:显示匹配到字符那行的前面n行 

   -C:显示匹配到字符那行的前后n行

pattern正则表达式主要参数:
\: 忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<:从匹配正则表达式的行开始。
\>:到匹配正则表达式的行结束。
[ ]:单个字符,如[A]即A符合要求 。
[ - ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。
.:所有的单个字符。
* :有字符,长度可以为0。

. * :任意长度的任意字符

字符匹配: 

    [0-9],[[:digit:]]   表示数字

    [a-z],[[:lower:]]   表示所有的小写字母

    [A-Z],[[:upper:]]  表示所有的大写字母 

    [[:space:]]  表示空白字符

    [[:punct:]]  特殊字符

    [[:alpha:]]  大小写字母

    [[:alnum:]]  字母数字

正则表达式

正则表达使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。简而言之,正则表达式就是处理字符串的方法,以行为单位进行字符串的处理,通过一些特殊符号的辅助,可以让用户轻松搜索/替换某特定的字符串。

 正则表达式分为两类:基本的正则表达式和扩展的正则表达式

基本的正则表达式:

1.元字符:

:匹配任意单个字符 

例如:查找包含studentstudent后面带一个字符的行

grep‘student.’/etc/passwd //模式可以用单引号和双引号,如果模式中要做变量替换时则必须用双引

[]:匹配指定范围内的任意单个字符,[abc],[a-z],[0-9],[a-zA-Z] 

 例如:查找带有数字的行 

 grep ‘[0-9]’ /etc/passwd 

[^]:匹配指定范围外的任意单个字符 

 例如:查找没有小写字母的行。 

grep ‘[^a-z]’ /etc/inittab 

2.次数匹配:

 *  :匹配其前面的字符任意次 

  例如:查找root出现0次或0次以上的行 

  grep ‘root*’ /etc/passwd 

.* :任意字符  

例如:查找包含root的行 

 grep ‘root.*‘ /etc/passwd 

\?:匹配其前面的字符1次或0 

\{m,n\} :匹配其前字符最少m,最多n次) 

3.字符锚定:

^:锚定行首,此字符后面的任意内容必须出现在行首 

 例如:查找行首以#开头的行 

 grep ‘^#‘ /etc/inittab 

$:锚定行尾,此字符前面的任意内容必须出现在行尾 

例如:查找行首以root结尾的行 

 grep ‘root$‘ /etc/inittab   

^$:锚定空白行,可以统计空白行 

 \<或者\b:锚定词首,其后面的任意字符必须做为单词首部出现 

例如:查找rootroot前面不包含任何字符的行 

  grep ‘\<root‘ /etc/man.config 

\>或者\b:锚定词尾,其前面的任意字符必须做为单词尾部出现                                  

例如:\<root\> 查找root单词  grep "\<root\>" =grep "\broot\b" 

扩展的正则表达式:

扩展的正则表达只是在基本的正则表达上作出了小小的一点修改,其修改如下:

     在扩展的正则表达中把\( \) 写成()、\{ \} 写成{ },另外加入了+:次数匹配,匹配其前面的字符至少出现一次,无上限、|: 或者(二取一),其余的都一样, 基本正则表达式,使用( ) { } . ? |都需要转义,在扩展正则表达中不需要加\,其详细信息如下:

(1)  字符匹配

.:匹配任意字符

[ ]: 指定范围内的字符

[^]匹配指定范围外的任意单个字符

 

   (2) 次数匹配:

 * :匹配其前面字符的任意次 

:匹配其前面字符的0此或1 

 + :匹配其前面字符至少1 

  例如:至少一个空白符: ‘[[:space:]]+‘ 

{m,n} :匹配其前面字符mn 


grep 的具体实例 

1、显示/proc/meminfo文件中以大写或小写s开头的行

 # grep -i ‘^s‘ /proc/meminfo

 # grep ‘^[Ss]‘ /proc/meminfo

2、显示/etc/passwd文件中其默认shell为非/sbin/nologin 的用户

#grep -v "/sbin/nologin$" /etc/passwd | sort -d:  -f1

3、显示/etc/passwd文件中其默认shwll为/bin/bash的用户

进一步:显示上述结果中其ID号最大的用户

#grep "/bin/bash$" /etc/passwd | sort -t: -k3 -n | tail -1 |cut -d: -f1

4、找出/etc/passwd文件中的一位数或两位数

#grep "\<[0-9][0-9]\?\>" /etc/passwd

#grep "\<[0-9]\{1,2\}\>" /etc/passwd

5、显示/boot.grub/grub.conf中以至少一个空白字符开头的行

# grep "^[[:space:]]\{1,\}"/boot/grub/grub.conf

6、显示/etc/rc.d/rc.sysinit文件中,以#开头,后面跟一个个空白字符,而后以在至少一非空白的行

#grep "^#[[:space:]]\{1,\}[^[:space:]]\{1,\}" /etc/rc.d/rc.sysinit

7、找出netstat - tan命令执行结果中以‘LISTEN’结尾的行

# netstat -tan | grep "LISTEN[[:SPACE:]]*$"

8、添加用户bash,testbash,basher,nologin(SHELL为/sbin/nologing)而找出当前系统上其用户名和默认shell相同的用户

#grep "^\([[:alnum:]]\{1,\}\):.*\1$"/etc/passwd

9、扩展题:新建一个文本文件,假设胡如下内容

    He like his lover

    He love his lover

    He like his liker

    He love his liker

找出其中最后人个单词是由此前某单词加r构成的行

 

 #grep "\(l..e\).*\1r" b.txt

10、显示当前系统上root、fedora或user1用户的默认shell

#gerp -E "^(root|fedora|user1)" /etc/passwd |cut -d:  -f7

11、 找出/etc/rc.d/init.d/functions文件中某单词后跟一组小括号“()”行

#grep -o -E "\<[[:alnum:]]+\>\(\)"/etc/rc.d/init.d/functions

12、使用echo命令输出一个路径,而后使用grep取出基名

echo/etc/sysconfig |grep 

#echo "/etc/sysconfig " |grep -o -E"[^/]/?$"

13、找出ifconfig 命令结果中的1-255之间的数字

#ifconfig | grep -o -E "\<([1-9] | [1-9] [0-9])|1[0-9][0-9] |2[0-4][0-9]|25[0-5])\>"


文本搜索必学命令-grep用法以及正则表达式

标签:表达式   单引号   双引号   字符串   linux   

原文地址:http://yenokia.blog.51cto.com/1899385/1662055

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!