码迷,mamicode.com
首页 > 其他好文 > 详细

文本处理工具简略

时间:2019-03-18 18:46:00      阅读:192      评论:0      收藏:0      [点我收藏+]

标签:字符   rip   linux中   follow   文件中   ons   文件名   uniq   tee   

文本处理工具 简略

cat [OPTION]...[FILE]

-E:显示行结束符$
-n:对显示出的每一行进行编号
-A:显示所有控制符
-b:非空行编号
-s:压缩连续的空行成一行
cat <fliename 创建一个新文件
cat file1 file2 > file 将几个文件合并为一个文件

tac(反向列示)

tac 是将 cat 反写过来,所以他的功能就跟 cat 相反, cat 是由第一行到最后一行连续显示在萤幕上,
而 tac 则是由最后一行到第一行反向在萤幕上显示出来!
在Linux中echo命令用来在标准输出上显示一段字符,比如:
echo "the echo command test!"
这个就会输出“the echo command test!”这一行文字!

rev

rev 命令是 reverse 的缩写,也是从文件的第一行扫描到最后一行,不过每行都是反转输出的。

more :分页查看文件

-d:显示翻页及退出提示

less:一页一页的查看文件或STDIN输出

查看时的命令: /文本 搜索 文本
n/N 跳到下一个 或上一个匹配 (n是顺序,N是倒序)
less 命令是man命令使用的分页器

head:显示文本前行内容(默认前十行)

语法: [option]...[file]...
-c# 指定获取前#字节
-n# 指定获取前#行
-# 指定行数

tail 显示文本后行内容 (默认十行)

语法:[option]...[file]...
-c# 指定获取后#字节
-n# 指定获取后#行
-# 指定行数
-f 跟踪显示文件fd新追加的内容,常用于日志监控,相当于 --follow=descriptor
-F 跟踪文件名,,相当于 --follow=name --retry
tailf 类似于tail -f,当文件不增长时不访问文件

cut 按列抽取文本

语法:[option]...[file]...
-d :指明分隔符,默认tab
-f :
#:第#个字段
#,#[,#]:离散的多个字段,例如1,3,6
-c:按字符切割
--output-delimiter=STRING指定输出分隔符

显示文件或STDIN数据的指定列

cut -d: -f1 /etc/passwd
cat /etc/passwd |cut -d: -f7
cut -c2-5 /usr/share/dict/wrods

pastee 合并两个文件同行号的列到一行

语法: paste [OPTION]... [FILE]...
-d 分隔符:指定分隔符,默认用TAB
-s : 所有行合成一行显示

wc:文本数据统计

计数单词总数、行总数、字节总数和字符总数
-l :只计数行数
-w :只计数单词总数
-c :只计数字节总数
-m :只计数字符总数
-L :显示文件中最长行的长度

sort 文本排序

把整理过的文本显示在STDOUT,不改变原始文件
语法:sort [options] file(s)
常用选项
-r 执行反方向(由上至下)整理
-R 随机排序
-n 执行按数字大小整理
-f 选项忽略(fold)字符串中的字符大小写
-u 选项(独特,unique)删除输出中的重复行
-t c 选项使用c做为字段界定符
-k X 选项按照使用c字符分隔的X列来整理能够使用多次

diff 比较两个文件之间的区别

-u

patch 复制对文件进行的改变

-b 选项来自动备份改变了的文件

uniq 从输入中删除前后相接的重复的行
语法:uniq [OPTION]... [FILE]...
-c: 显示每行重复出现的次数
-d: 仅显示重复过的行
-u: 仅显示不曾重复的行
注:连续且完全相同方为重复

文本处理工具简略

标签:字符   rip   linux中   follow   文件中   ons   文件名   uniq   tee   

原文地址:https://blog.51cto.com/14233371/2364855

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!