decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unico ...
分类:
编程语言 时间:
2016-04-03 20:13:15
阅读次数:
131
字符串在Python内部的表示是unicode 编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码,如str ...
分类:
编程语言 时间:
2016-03-30 06:54:42
阅读次数:
158
刚开始使用http中间件做爬虫其实蛮多坑的,最主要的坑就是编码问题,有很多中文网站的采用的gb2313的编码方式,这个在爬到的报文解析就很蛋碎, 因为http中间件对utf-8支持的比较好,所以针对这一点我们需要对于gb2312的网站做编码转换处理 这里我使用了mongoose,所以node执行js
分类:
数据库 时间:
2016-03-22 19:04:54
阅读次数:
409
Python2.6.6(r266:84292,Jul232015,15:22:56)[GCC4.4.720120313(RedHat4.4.7-11)]onlinux2Type"help","copyright","credits"or"license"formoreinformation.>>>printord(‘A‘)65>>>...>>>a={"a":"1","b","2"}File"<stdin>",line1a={"a":"1","b..
分类:
编程语言 时间:
2016-03-22 01:02:18
阅读次数:
419
1.编码转换 public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException { // TODO Auto-g
分类:
其他好文 时间:
2016-03-08 23:40:24
阅读次数:
182
与server进行数据交换时,尤其是数据中含有中文时,要注意中文的编码问题。要选择server接受的编码方式,否则会造成显示乱码。 经验: 实验室server的数据库,中文用UTF-8编码,但我提交的是GBK编码的中文,结果出现乱码: 于是借鉴了网上的代码。加入了自己主动转换指定编码的函数: #Ch
分类:
编程语言 时间:
2016-02-22 22:07:13
阅读次数:
263
用 Sublime Text 2 保存中文后乱码问题的解决方法(可能解决) https://blog.twofei.com/blog iconv字符编码转换 UTF-8 UCS-2(LE/BE) GBK 在群里面听到有人说起有一款新的编辑器 Sublime Text 2 很不错, 于是我下载下来试用
分类:
其他好文 时间:
2016-02-15 16:15:03
阅读次数:
120
1、首先介绍write()和print()方法的区别: (1)、write():仅支持输出字符类型数据,字符、字符数组、字符串等 (2)、print():可以将各种类型(包括Object)的数据通过默认编码转换成bytes字节形式,这些字节都通过write(int c)方法被输出 2、介绍respo
分类:
其他好文 时间:
2016-02-04 13:20:14
阅读次数:
116
解决Linux文档显示中文乱码问题以及编码转换 解决Linux文档显示中文乱码问题以及编码转换 使vi支持GBK编码 由于Windows下默认编码是GBK,而linux下的默认编码是UTF-8,所以打开会变成乱码。因此,我们只需要改变一下配置文件,使得vi支持GBK 打开~/.vimrc文件 加上
分类:
系统相关 时间:
2016-01-29 15:58:04
阅读次数:
178
转自:http://www.leyle.com/archives/canonicalize_url.html思考一下:对url进行规范化处理是否是必须的?因为这一步处理涉及到编码转换,对于一个网页的新链发现来说是比较耗时的。为什么需要格式化 url?比如下面几个url:http://www.exam...
分类:
Web程序 时间:
2016-01-24 23:40:43
阅读次数:
251