码迷,mamicode.com
首页 >  
搜索关键字:文本处理    ( 1321个结果
Python自动化办公 — 对 word 文本处理实现自动化操作!
之前介绍了一个Python包 openpyxl ,用于处理 Excel ;而对于 Word 文本时同样也有对应的 Python库 Python-docx,在日常办公中,如果需要处理多个 word 文本,且操作步骤都是重复单调的,我想这个库就可以帮到你 在了解 Python-docx 常用函数之前,需 ...
分类:编程语言   时间:2020-10-29 10:43:18    阅读次数:32
文本处理工具之 sed1
概念:默认是行处理sed是流编辑器,一次处理一行内容,把当前处理的行存储在临时缓冲区中,称为模式空间。接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕,然读入下行,执下一循环。没有使用特殊命令,会在两个循环之间清空模式空间,但不会清空保留空间。直到文件末尾。文件内容并没有改变,除非使用重定向定向输出存储。默认是打印sedoption[sed脚本]file常用选项:-n:不输出
分类:其他好文   时间:2020-10-16 11:19:23    阅读次数:27
文本处理工具之 sed1
概念:默认是行处理sed是流编辑器,一次处理一行内容,把当前处理的行存储在临时缓冲区中,称为模式空间。接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕,然读入下行,执下一循环。没有使用特殊命令,会在两个循环之间清空模式空间,但不会清空保留空间。直到文件末尾。文件内容并没有改变,除非使用重定向定向输出存储。默认是打印sedoption[sed脚本]file常用选项:-n:不输出
分类:其他好文   时间:2020-10-16 11:16:11    阅读次数:23
linux文本处理之 grep
概念:grep:文本过滤(模式:pattern)工具grep,egrep,fgrep(不支持正则表达式搜索)sed:streameditor,文本编辑工具awk:文本报告生成器grep:默认是过滤行和cut相反作用:文本搜索工具,根据用户指定的”模式“对目标文本逐行进行匹配检查;打印匹配到的行!!模式:有正则表达式字符及文本字符所编写的过滤条件grep[OPTIONS]PATTERN[FILE..
分类:系统相关   时间:2020-10-06 20:54:20    阅读次数:38
shell 中高级学习计划
1、变量高级用法 2、函数的高级用法。包括返回值、返回值类型、如何使用返回值 3、文件查找命令高级用法。包括 find(所有知识)、grep等 4、shell 文本处理-三剑客。grep、sed、awk(报告生成器),通常需要把这三个结合起来使用。 5、实际案例,大量练习,包括 监控脚本的编写、数据 ...
分类:系统相关   时间:2020-09-18 00:34:24    阅读次数:43
Python之mmap内存映射模块(大文本处理)
背景: 通常在UNIX下面处理文本文件的方法是sed、awk等shell命令,对于处理大文件受CPU,IO等因素影响,对服务器也有一定的压力。关于sed的说明可以看了解sed的工作原理,本文将介绍通过python的mmap模块来实现对大文件的处理,来对比看他们的差异。 说明: mmap是一种虚拟内存 ...
分类:编程语言   时间:2020-09-17 21:25:55    阅读次数:40
5个例子征服awk
awk是非常实用的文本处理工具,我们试图用5个例子了解awk的基本用法 基本用法:awk BEGIN{扫描前执行的操作} '匹配模式{执行的操作}' END{扫描后执行的操作} 其中,BEGIN{扫描前执行的操作}和END{扫描后执行的操作}不是必须的 例子1:netstat -alepn | aw ...
分类:其他好文   时间:2020-08-15 22:36:41    阅读次数:78
文本处理工具和正则表达式练习
1、在vim中设置tab缩进为4个字符setautoindent或setai2、复制/etc/rc.d/init.d/functions文件至/tmp目录,替换/tmp/functions文件中的/etc/syscon?g/init为/var/logcp/etc/rc.d/init.d/functions/tmpvim/tmp/functions%s@/etc/sysconfig/init@/va
分类:其他好文   时间:2020-07-23 22:52:48    阅读次数:76
NLP——天池新闻文本分类 Task1
NLP——新闻文本处理:TASK1 赛题理解与nlp初识 1.数据读取 在竞赛主页下载好数据集利用pandas打开: #coding=utf-8 import pandas as pd #my_font = font_manager.FontProperties(fname="C:\Windows\ ...
分类:其他好文   时间:2020-07-21 23:13:12    阅读次数:112
C#-CLR-字符、字符串、文本处理
##提升性能 字符串留用:内部哈希表来留存字符串 (key:字符串,value:string对象) 局限性: 如果留用的复用性不高,反而总体性能下降。因为留用操作会有消耗 (这正是C#编辑器默认不开启留用的原因) //CLR不同版本,字面值(literal)的引用有可能是同一个对象(字符串留用),也 ...
分类:Windows程序   时间:2020-07-14 10:40:32    阅读次数:163
1321条   上一页 1 2 3 4 5 ... 133 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!