计算机中的编码问题 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节 ...
分类:
其他好文 时间:
2017-07-21 00:04:57
阅读次数:
238
catfile1.txtfile2.txt>file3.txtsortfile3.txt|uniq>newfile.txtnewfile即为去重后的文件
分类:
编程语言 时间:
2017-07-20 11:37:55
阅读次数:
174
re.Sre.DOTALL影响'.'的行为,平时'.'匹配除换行符以外的所有字符,指定了本标志以后,会匹配所有字符包括换行符。 re.compile 使用re.compile()函数,将正则表达式的字符串形式编译为Pattern实例/对象,然后使用Pattern实例处理文本并获得匹配结果 ...
分类:
编程语言 时间:
2017-07-17 18:56:43
阅读次数:
140
awk命令简介:awk是一个强大的文本分析工具,通常,awk是以文件的每一行,为处理单位的。awk每接收文件的一行,然后执行相应的命令,来处理文本。1.命令格式:awk‘pattern{action}‘{filenames}其中pattern表示AWK在数据中查找的内容,而action是在找到匹配内容时所执行的一系列..
分类:
系统相关 时间:
2017-07-10 16:29:39
阅读次数:
223
java对文本文档进行操作(拷贝、显示)出现乱码一般来说,可以从两个方面入手。 1、文本文件本身的编码格式。 2、java代码中处理文本文件的编码格式。 这里要注意的一点是,我们可以看出copyFileByByte方法和copyFileByChar1方法都是没有办法设置目的文件的编码格式的,并且处理... ...
分类:
编程语言 时间:
2017-07-09 18:26:13
阅读次数:
305
网上常常看到这种交互方式,当去一个站点注冊username的时候,假设文本框内没有输入数据,或者数据输入的内容格式不正确。就会将文本框变成红色来提示你输入的内容有误。 自己将这个文本框验证的方式改变了一下,并用到了get方法进行数据处理:1.点击提交button时假设文本框为空,文本框就会变成红色边 ...
分类:
Web程序 时间:
2017-07-08 11:27:46
阅读次数:
275
http协议分析http协议介绍http:HyperTextTransferProtocol超文本传输协议,是互联网应用最为广泛的一种网络协议,主要用于Web服务。通过计算机处理文本信息,格式为HTML(HyperTextMarkLanguage)超文本标记语言来实现。http协议的版本http0.9:仅于用户传输html文档http1.01...
分类:
Web程序 时间:
2017-07-03 10:09:20
阅读次数:
272
8-7参考阅读 - 读文件、写文件、异常处理、文件保存游戏、pickle数据转成文本的过程又被称为“序列化”,即将对象状态转换为可保持或传输的格式的过程。对应的,从序列化的格式中解析对象状态的过程被称为“反序列化”。 import pickle#序列化,反序列化,所以文件中的内容要求是列表或元组 t ...
分类:
编程语言 时间:
2017-07-02 20:26:53
阅读次数:
265
下面将介绍Linux下使用Shell处理文本时最常用的工具:find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk;提供的例子和参数都是最常用和最为实用的;我对shell脚本使用的原则是命令单行书写,尽量不要超过2行;如果有更为复杂的任务需求,还是考虑python吧;find文..
分类:
系统相关 时间:
2017-06-30 12:19:40
阅读次数:
216
功能: 自动处理文件,分析日志文件,修改配置文件 1.sed如何进行文本处理? 下图是处理机制,它是处理一行输出一行,不改变文件内容除非重定向 sed处理文本过程: 先用正则选定文本,然后sed进行处理 命令行模式: sed 【option】 'command' files //如果没有文件可以通过 ...
分类:
其他好文 时间:
2017-06-26 19:55:25
阅读次数:
157