awk命令 解释awk是一种处理文本文件的语音用法echo "IP=32.138.39.22" | awk -F= '{print $2}' (-F指定分隔符,这边指定 = 为分隔符)注意:文本 IP=32.138.39.22 中 $1 为IP,$2 为32.138.39.22 = 有边有一个空格c ...
分类:
其他好文 时间:
2018-07-18 19:00:42
阅读次数:
130
第六课-第二讲06_02_sed命令灵活按照我们需要充分处理文件要掌握三大利器:grep,sed(流编辑器),awk(报告文本生成器)1.sed的基本用法-sed=StreamEditor--操作纯ascii的文本的,他是逐行处理文本的,所以也叫行编辑器(与之相对的叫全屏编辑器:vi)sed工作机制:并不直接处理文本文件本身,而是每次读取一行到内存空间,在内存中完成编辑,并且将编辑结果输出到屏幕,
分类:
其他好文 时间:
2018-07-16 15:01:12
阅读次数:
135
sed(stream editor)是一种非交互的流编辑器,通过多种转换修改流经它的文本。但是,默认情况下,sed并不会改变原文件本身,而只是通过sed命令的文本进行修改,并将修改后的结果打印到标准输出中(也就是屏幕)。sed处理文本时是以行为单位的,每处理完一行就立即打印出来,然后再处理下一行,直至全文处理结束。准备如下文件Sed.txtthis&
分类:
系统相关 时间:
2018-07-16 12:26:24
阅读次数:
228
什么是TF IDF IF IDF(term frequency inverse document frequency)词频 逆向文件频率。在处理文本时,如何判断某一个词在文本中的重要性呢?IF IDF就是解决这个问题。字词的重要性与其在文本中出现的频率成正比(IF),与其在语料库中出现的频率成反比( ...
分类:
其他好文 时间:
2018-07-13 23:17:32
阅读次数:
318
正则表达式 正则表达式定义了字符串的模式。 正则表达式可以用来搜索、编辑或处理文本。 正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。 语法: 在 Java 中,\\ 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。 Matcher 类的方法 索引方法 索引方法提供 ...
分类:
编程语言 时间:
2018-07-12 16:30:52
阅读次数:
126
今日主要内容 文件操作: 1. r(读取文件)处理文本 2. w(写入之前会去掉原来的内容)处理文本 3. a(在原来的基础上进行追加内容)处理文本 4. r+(再r基础上进行了扩展,不管你前面写了几个,后面去写,是在末尾),默认情况下光标在文件的开头,必须先读后写, 读写模式. 需要移动光标进行反 ...
分类:
编程语言 时间:
2018-07-11 22:48:30
阅读次数:
183
*sed的详细用法*sed:streameditor流编辑器sed的工作模式;sed是一个行文本编辑器,默认每次处理文本中所匹配到一行内容到模式空间,然后用后面的命令进行操作,操作完成之后,会把模式空间里面的内容实现在屏幕上,然后把模式空间的中的内容删除,同时把下一行所匹配到内容读入模式空间为了下面演示方便,我们创建一个文本文件a.text#cata.textzzxxtomxxtomrhcexxr
分类:
其他好文 时间:
2018-07-11 10:33:24
阅读次数:
201
关于机器学习,自己也是半路出家,没啥基础, 不过知识也是一点一点积累起来的。tf-idf是在处理文本中很常用的一个公式, 下面记录一下自己对它的理解: tf :计算某个词在某个文档中的词频(即某个词在它所在的行中出现的次数,在spark ml的表示中,一行代表一个文档)。 idf: 逆向文档频率, ...
分类:
其他好文 时间:
2018-07-10 19:17:29
阅读次数:
161
Java 正则表达式 正则表达式定义了字符串的模式。 正则表达式可以用来搜索、编辑或处理文本。 正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。 正则表达式实例 一个字符串其实就是一个简单的正则表达式,例如 Hello World 正则表达式匹配 "Hello World" 字符串。 ...
分类:
移动开发 时间:
2018-06-30 14:59:39
阅读次数:
213
一:应用情景①,如果游戏需要进军海外的时候,需要将一些通用的美术字批量转换成外语版的.本篇是基于ps2015cc批量处理文本的初始探索,有不少的局限性.二:步骤1`新建一个文本图层aaaa,其余的都去掉,如下图:2`新建一个excel文件,并在里面写入替换的文本.注意头部名称:name(自定义的)3`将excel导出(另存)为txt文件(aaa.txt),文本格式如下:4`图像->变量-&g
分类:
其他好文 时间:
2018-06-29 16:24:44
阅读次数:
284