码迷,mamicode.com
首页 >  
搜索关键字:处理文本    ( 769个结果
19-awk
awk命令 解释awk是一种处理文本文件的语音用法echo "IP=32.138.39.22" | awk -F= '{print $2}' (-F指定分隔符,这边指定 = 为分隔符)注意:文本 IP=32.138.39.22 中 $1 为IP,$2 为32.138.39.22 = 有边有一个空格c ...
分类:其他好文   时间:2018-07-18 19:00:42    阅读次数:130
第六课-第二讲06_02_sed命令
第六课-第二讲06_02_sed命令灵活按照我们需要充分处理文件要掌握三大利器:grep,sed(流编辑器),awk(报告文本生成器)1.sed的基本用法-sed=StreamEditor--操作纯ascii的文本的,他是逐行处理文本的,所以也叫行编辑器(与之相对的叫全屏编辑器:vi)sed工作机制:并不直接处理文本文件本身,而是每次读取一行到内存空间,在内存中完成编辑,并且将编辑结果输出到屏幕,
分类:其他好文   时间:2018-07-16 15:01:12    阅读次数:135
linux学习-文本处理工具sed
    sed(stream editor)是一种非交互的流编辑器,通过多种转换修改流经它的文本。但是,默认情况下,sed并不会改变原文件本身,而只是通过sed命令的文本进行修改,并将修改后的结果打印到标准输出中(也就是屏幕)。sed处理文本时是以行为单位的,每处理完一行就立即打印出来,然后再处理下一行,直至全文处理结束。准备如下文件Sed.txtthis&
分类:系统相关   时间:2018-07-16 12:26:24    阅读次数:228
sklearn文本特征提取——TfidfVectorizer
什么是TF IDF IF IDF(term frequency inverse document frequency)词频 逆向文件频率。在处理文本时,如何判断某一个词在文本中的重要性呢?IF IDF就是解决这个问题。字词的重要性与其在文本中出现的频率成正比(IF),与其在语料库中出现的频率成反比( ...
分类:其他好文   时间:2018-07-13 23:17:32    阅读次数:318
Java基础-正则表达式
正则表达式 正则表达式定义了字符串的模式。 正则表达式可以用来搜索、编辑或处理文本。 正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。 语法: 在 Java 中,\\ 表示:我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。 Matcher 类的方法 索引方法 索引方法提供 ...
分类:编程语言   时间:2018-07-12 16:30:52    阅读次数:126
python14期2017.7.11
今日主要内容 文件操作: 1. r(读取文件)处理文本 2. w(写入之前会去掉原来的内容)处理文本 3. a(在原来的基础上进行追加内容)处理文本 4. r+(再r基础上进行了扩展,不管你前面写了几个,后面去写,是在末尾),默认情况下光标在文件的开头,必须先读后写, 读写模式. 需要移动光标进行反 ...
分类:编程语言   时间:2018-07-11 22:48:30    阅读次数:183
sed的基本用法和高级用法
*sed的详细用法*sed:streameditor流编辑器sed的工作模式;sed是一个行文本编辑器,默认每次处理文本中所匹配到一行内容到模式空间,然后用后面的命令进行操作,操作完成之后,会把模式空间里面的内容实现在屏幕上,然后把模式空间的中的内容删除,同时把下一行所匹配到内容读入模式空间为了下面演示方便,我们创建一个文本文件a.text#cata.textzzxxtomxxtomrhcexxr
分类:其他好文   时间:2018-07-11 10:33:24    阅读次数:201
TF-IDF小记
关于机器学习,自己也是半路出家,没啥基础, 不过知识也是一点一点积累起来的。tf-idf是在处理文本中很常用的一个公式, 下面记录一下自己对它的理解: tf :计算某个词在某个文档中的词频(即某个词在它所在的行中出现的次数,在spark ml的表示中,一行代表一个文档)。 idf: 逆向文档频率, ...
分类:其他好文   时间:2018-07-10 19:17:29    阅读次数:161
业余草 Java正则表达式,验证手机号和电话号码
Java 正则表达式 正则表达式定义了字符串的模式。 正则表达式可以用来搜索、编辑或处理文本。 正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。 正则表达式实例 一个字符串其实就是一个简单的正则表达式,例如 Hello World 正则表达式匹配 "Hello World" 字符串。 ...
分类:移动开发   时间:2018-06-30 14:59:39    阅读次数:213
Egret之美术字批处理尝试(基础)
一:应用情景①,如果游戏需要进军海外的时候,需要将一些通用的美术字批量转换成外语版的.本篇是基于ps2015cc批量处理文本的初始探索,有不少的局限性.二:步骤1`新建一个文本图层aaaa,其余的都去掉,如下图:2`新建一个excel文件,并在里面写入替换的文本.注意头部名称:name(自定义的)3`将excel导出(另存)为txt文件(aaa.txt),文本格式如下:4`图像->变量-&g
分类:其他好文   时间:2018-06-29 16:24:44    阅读次数:284
769条   上一页 1 ... 20 21 22 23 24 ... 77 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!