基本正则表达式格式:grep[options]‘PATTERF‘file--color=auto匹配到的选项带颜色显示-q静默模式,不输出任何信息-v匹配反向,显示不能被匹配到的行-o仅显示匹配到的选项,并不是显示正行-i匹配时忽略大小写-E使用扩展的正则表达式-ANUM显示匹配到行的后NUM行-BNUM显示匹配到行的前NUM行-CNUM显示匹配到行的前后各NUM行-m#匹配#次后
分类:
其他好文 时间:
2019-03-18 15:15:10
阅读次数:
147
文本处理三剑客(grep)grep:文本过滤(模式:pattern)工具grep,egrep,fgrep(不支持正则表达式搜索)作用:文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查;打印匹配到的行模式:由正则表达式字符及文本字符所编写的过滤条件grep命令选项-color=auto:对匹配到的文本着色显示-m#匹配#次后停止-v显示不被pattern匹配到的行-I忽略字符大小写-n
分类:
其他好文 时间:
2019-03-16 15:34:56
阅读次数:
168
文件查看:cat[OPTION]...[FILE]...-E:显示行结束符$-n:对显示出的每一行进行编号-A:显示所有控制符-b:非空行编号-s:压缩连续的空行成一行tac:内容倒过来显示rev:每行倒过来显示more:分页查看文件more[OPTIONS...]FILE...-d:显示翻页及退出提示例:ls-R/etc/|more,它翻到最后就退出了less:一页一页地查看文件或STDIN输出
分类:
系统相关 时间:
2019-03-16 14:16:09
阅读次数:
261
1.命令cut 命令用于对文本进行切割 基本用法 用法:cut [选项]... [文件]... 从每个文件中输出指定部分到标准输出。 长选项必须使用的参数对于短选项时也是必需使用的。 b, bytes=列表 只选中指定的这些字节 c, characters=列表 只选中指定的这些字符 d, deli ...
分类:
系统相关 时间:
2019-03-08 23:34:01
阅读次数:
258
单机文本数据处理,常用AWK,总结一下AWK最常用的要点,备忘备查。 1.What is AWK(1)Aho、Weinberger、Kernighan三位发明者名字首字母;(2)一个行文本处理工具; 2.How to use AWK2.1 处理方式:逐行处理文件中的数据 2.2语法: awk 'pa ...
分类:
其他好文 时间:
2019-03-02 10:23:00
阅读次数:
195
1 概述 平衡组是微软在.NET中提出的一个概念,主要是结合几种正则语法规则,提供对配对出现的嵌套结构的匹配。.NET是目前对正则支持最完备、功能最强大的语言平台之一,而平衡组正是其强大功能的外在表现,也是比较实用的文本处理功能,目前只有.NET支持,相信后续其它语言会提供支持。 平衡组可以有狭义和 ...
分类:
Web程序 时间:
2019-03-01 23:32:59
阅读次数:
272
朴素贝叶斯 朴素贝叶斯概述 文本分类 准备数据:从文 本中构建词向量 训练算法:从词向量计算概率 贝叶斯分类函数 词袋模型 一个小优化,相比与之前只统计词出现与否的词条模型,词袋模型统计词出现的次数 垃圾邮件过滤 不清楚为什么我做出来的错误率这么高,算了,先放着吧 最后一个不写了 ...
分类:
其他好文 时间:
2019-02-26 11:54:06
阅读次数:
195
文件和目录 查看文件内容 文本处理 查找 压缩和解压 yum工具 网络 其他 常用快捷键 ...
分类:
其他好文 时间:
2019-02-25 20:12:17
阅读次数:
225
linux上文本处理上剑客:grep:文本过滤工具(模式:pattern)工具;grep:基本正则表达式,-E-Fegrep:扩展正则表达式,-G-Ffgrep:不支持正则表达式,sed:streameditor.流编辑器;文本编辑工具;awk:linux上的实现为gawk,文本报告生成器(格式化文本);正则表达式:由一类特殊字符及文本字符所编写的模式,其中有些字符不表示其字面意义,而是用于表示控
分类:
其他好文 时间:
2019-02-24 16:19:49
阅读次数:
253
1.2.1 cut命令 cut命令可以从一个文本文件或者文本流中提取文本列。 cut语法 [root@www ~]# cut -d'分隔字符' -f fields ## 用于有特定分隔字符 [root@www ~]# cut -c 字符区间 ## 用于排列整齐的信息 选项与参数: -d:后面接分隔字 ...
分类:
系统相关 时间:
2019-02-20 09:46:34
阅读次数:
194