码迷,mamicode.com
首页 >  
搜索关键字:文本处理    ( 1321个结果
编程小技巧之 Linux 文本处理命令
合格的程序员都善于使用工具,正所谓君子性非异也,善假于物也。合理的利用 Linux 的命令行工具,可以提高我们的工作效率。 ...
分类:系统相关   时间:2019-09-26 23:55:48    阅读次数:171
Linux入门基础之 下
八、Linux 管道、重定向及文本处理 8.1、Linux 多命令协作:管道及重定向 8.1.1 开源文化 开源文化的核心理念之一就是不要重复发明轮子,很多的开源软件都是现有软件、代码、功能的重新组合,就好像通过零件装配机器一样,源代码的开放和共享让这成为了可能,同时也大大的提高了效率和生产力。 8 ...
分类:系统相关   时间:2019-09-26 09:37:09    阅读次数:82
sort和uniq的使用
sort用于对文本按行来排序,默认是以ascii字符的顺序排列sort-n按照数字大小排列顺序来排序sort-r反向排序sort支持处理多个文件,将多个文件组合成一个文本处理uniq是去重的命令,去除重复的行,注意只会去除连续相同行的uniq-c统计并显示重复行的个数uniq常和sort结合:sortfile|uniq-cuniq和sort组成集合运算:假设有两个文件:file1和file21.求
分类:其他好文   时间:2019-09-24 19:08:52    阅读次数:116
linux文本处理三剑客命令及用法
grep:文本过滤工具 功能说明: sed :字符流编辑器 功能说明: awk : ...
分类:系统相关   时间:2019-09-22 14:50:05    阅读次数:102
RegEx正则表达式
正则表达式主要用于文本的复杂处理,是一种强大而灵活的文本处理工具并且支持大部分的编程语言、数据库、文本编辑器、开发环境。 ...
分类:其他好文   时间:2019-09-18 01:29:45    阅读次数:132
linux文本处理三剑客之 grep
文本处理无非是对文本内容做查看、修改等操作。Linux三剑客: grep、sed 和 awk 命令。 处理文本内容,用 Vim 编辑器不是很好吗?Vim 允许我们使用键盘、鼠标来对文本内容进行交互性地修改,但在某些场景中,我们可能需要实现对文本内容做自动化的处理,而不是手工处理。 很多时候,我们并不 ...
分类:系统相关   时间:2019-09-07 22:00:22    阅读次数:128
grep 命令使用
grep是Linux中最常用的"文本处理工具"之一,用于在文本中查找指定的字符串。 语法: grep [OPTION]... PATTERN [FILE]... 参数: -i:在搜索的时候忽略大小写 -n:显示结果所在行号 -c:统计匹配到的行数,注意,是匹配到的总行数,不是匹配到的次数 -o:只显 ...
分类:其他好文   时间:2019-09-06 17:28:57    阅读次数:99
SQL必知必会-08
使用函数处理数据 函数 SQL可以通过函数来处理函数,但是,大多数函数不能被不同的DBMS共用,也就是移植性不高。 使用函数 文本处理函数 将文本全部变为大写的函数:upper() eg: select vend_name, upper(vend_name) as vend_name_upcase ...
分类:数据库   时间:2019-09-04 09:49:12    阅读次数:105
shell 脚本——第七节课 三剑客之sed语句
sed命令 Linux文本处理三剑客 之 sed sed stream EDite 作为行编辑器,对文本进行编辑(以行为单位进行编辑) 注意:sed编辑文件,却不改变原文件; sed的工作原理: 指定一个文本文件,依次读取文本文件中每行的内容,读取到模式空间中(PATTERN SPACE),在模式空 ...
分类:系统相关   时间:2019-09-01 14:42:15    阅读次数:96
python实例:自动爬取豆瓣读书短评,分析短评内容
思路: 1、打开书本“更多”短评,复制链接 2、脚本分析链接,通过获取短评数,计算出页码数 3、通过页码数,循环爬取当页短评 4、短评写入到txt文本 5、读取txt文本,处理文本,输出出现频率最高的词组(前X) 通过分析得到其他结果可自由发散 用到的库: 整个脚本如下 执行结果 需要注意的是,如果 ...
分类:编程语言   时间:2019-08-31 21:26:18    阅读次数:117
1321条   上一页 1 ... 13 14 15 16 17 ... 133 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!