sed入门详解教程 sed 是一个比较古老的,功能十分强大的用于文本处理的流编辑器,加上正则表达式的支持,可以进行大量的复杂的文本编辑操作。sed 本身是一个非常复杂的工具,有专门的书籍讲解 sed 的具体用法,但是个人觉得没有必要去学习它的每个细节,那样没有特别大的实际意义。网上也有很多关于 se ...
分类:
系统相关 时间:
2018-11-17 19:19:56
阅读次数:
166
1、概述: Regular Expression。缩写regex,regexp,R等: 正则表达式是文本处理极为重要的工具。用它可以对字符串按照某种规则进行检索,替换。 Shell编程和高级编程语言中都支持正则表达式。 2、分类: BRE:基本正则表达式,grep、sed、vi等软件支持,vim有扩 ...
分类:
编程语言 时间:
2018-11-13 03:00:32
阅读次数:
160
1、简述rpm与yum命令的常见选项,并举例rpm命令:语法:rpm[OPTIONS][PACKAGE_FILE]选项:安装:-i,--install升级:-U,--update,-F,--freshen卸载:-e,--erase查询:-q,--query校验:-v,--verify1)安装语法:rpm{-i|--install}[install-options]PACKAGE_FILE...选项
分类:
其他好文 时间:
2018-11-11 19:07:16
阅读次数:
153
Linux文本处理命令 cat: 功能:链接文件并输出到标准输出 选项: -n :显示行号 -E:显示行结束符($),Windows是(回车符+$)在widows上编辑的文件在Linux中识别不了了,但是可以使用notepad++软件编辑的文件在Linux中可以使用 分屏显示 more 功能 :将文 ...
分类:
系统相关 时间:
2018-11-10 15:24:13
阅读次数:
156
基本概念 盒子模型,英文即box model。无论是div、span、还是a都是盒子,他们在网页上都要占据一定的空间,在进行布局的时候需要考虑他们所占据的空间大小。 例外情况:图片、表单元素作为文本处理,不作为盒子模型计算。 盒子模型主要CSS属性 盒子的属性有5个:width、height、pad ...
分类:
Web程序 时间:
2018-11-06 11:08:40
阅读次数:
148
Spark Java API 之 CountVectorizer 由于在Spark中文本处理与分析的一些机器学习算法的输入并不是文本数据,而是数值型向量。因此,需要进行转换。而将文本数据转换成数值型的向量有很多种方法,CountVectorizer是其中之一。 A CountVectorizer c ...
分类:
编程语言 时间:
2018-11-04 00:43:22
阅读次数:
240
awk的学习使用 awk是一门文本处理语言,功能强大,用法灵活,而且还可以处理一些cut无法完成的操作。下面是我结合网络上的资料,以及自己的实践的一些示例,对用法的一些总结。 awk的学习使用 awk是一门文本处理语言,功能强大,用法灵活,而且还可以处理一些cut无法完成的操作。下面是我结合网络上的 ...
分类:
其他好文 时间:
2018-11-01 22:23:48
阅读次数:
207
a.ToUpperInvariant();var b1 = a.Equals("a", StringComparison.OrdinalIgnoreCase);== 比较的是变量(栈)内存中存放的对象的(堆)内存地址,用来判断两个对象的地址是否相同,即是否是指相同一个对象。比较的是真正意义上的指针操 ...
分类:
其他好文 时间:
2018-10-30 23:54:17
阅读次数:
143
linux文本处理命令:grep、sed、printf、awk (refer to https://www.cnblogs.com/sheeva/p/6406285.html ) 1.grep grep的作用是按行查找字符,输出包含字符的行。 grep使用示例: grep的查找主要就是基于基本正则表 ...
分类:
系统相关 时间:
2018-10-25 23:45:09
阅读次数:
193
date -d @时间戳 "+%Y-%m-%d %H:%M:%S" 也可以内置函数 awk '{print strftime("%Y-%m-%d %H:%M:%S", $1)}' 如果是毫秒级的时间戳要先除以1000; 在 shell 中这样子处理: awk '{print $1","$2","st ...
分类:
系统相关 时间:
2018-10-18 00:55:34
阅读次数:
410