标签:输出 多少 文件的 统计 相互 文本 去除 ascii 自定义
cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。
一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。
-c :
    以字符为单位进行分割。
    cut -c1-3 test.txt:打印第1个到第3个字符
    cut -c5- test.txt:打印从第5个字符开始到结尾
-d :
    自定义分隔符,默认为制表符。
    cut -d';' -f 1
-f :
    用-d将文本分隔成一段一段后,-f用来取出第几段
    cut -f1 test.txt:取出一行分割后的第一个
    cut -f2,3 test.txt:取出一行分割后的第2到3个sort将文件的每一行作为一个单位,相互比较。
比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。
-u : 
    它的作用很简单,就是在输出行中去除重复行。
-r : 
    sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。
-n : 
    以数值来进行排序。
-f : 
    忽略大小写
cat ld | sort -nuniq命令可以在排序后处理重复的行。
常用选项:
-i
    忽略大小写
-c
    在行的开头输出该行出现的次数
-d
    只输出重复的行
-u
    只输出出现过一次的行
sort -n ld | uniq -cwc统计文件里面有多少单词,多少行,多少字符。
-l
    仅列出行;
-w
    仅列出多少字(英文单字);
-m
    多少字符;标签:输出 多少 文件的 统计 相互 文本 去除 ascii 自定义
原文地址:https://www.cnblogs.com/loveer/p/11621718.html