判断字符串编码使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要>>> import urllib>>> html = urllib.urlopen('http://www.ch...
分类:
编程语言 时间:
2015-04-04 14:58:33
阅读次数:
234
首先,对论坛的管理人还有论坛某些冷眼旁观的人们表示遗憾。昨天遇到了GBK和UTF8互转问题,查了不少资料都没理出头绪,发帖提问无人问津,给管理留言亦是杳无音信。花费了几个小时,查了不少资料(其他论坛),经过N词失败之后终于转换成功,在这里分享给大家,希望能给有需要的同学们提供帮助。废话不说了,下面是...
分类:
数据库 时间:
2015-04-04 13:26:07
阅读次数:
175
UTF-8 GBK 是中文字符 二进制 存储层面的问题url-encode / http层 应用层,在浏览器与服务端交互时需考虑;在服务器与服务器时则不要考虑;浏览器使用$.ajax()发送中文字符时,处理过程:中文字符--->对应的字符编码表示----> 进行urlencode public s....
分类:
其他好文 时间:
2015-04-03 16:59:01
阅读次数:
147
字符集就是一套文字符号及其编码。常用的字符集有:GBK定长双字节不是国际标准,支持的系统不少UTF-8非定长1-4字节广泛支持,MYSQL也使用UTF-8当然了,字符集还有很多,以后再深入学习这部分内容。①linux系统下的字符集由变量LANG控制。[root@gagarin~]#echo$LANGzh_CN.GB1803..
分类:
系统相关 时间:
2015-04-03 11:34:36
阅读次数:
176
今天在做一个Java Web项目的时候,html中的汉字在浏览器中显示为乱码,分析其可能原因有:
(1)html文件属性中有默认的编码方式,如果它的设置与html文档中content charset属性设置有冲突,则显示为乱码。
(2)与浏览器有关,如果html的编码方式与浏览器默认的编码方式不同,则会出现乱码。
下面直接上图,看我的实验:
(1)html的文件属性和content charset都设置为UTF-8,但是浏览器默认是GBK编码,显示乱码。我用了谷...
分类:
编程语言 时间:
2015-04-03 11:19:33
阅读次数:
158
【问题】python中已获取网页:http://blog.csdn.net/hfahe/article/details/5494895的html源码,其时UTF-8编码的。提取出其标题部分: 在2008 Beijing Perl 大会的演讲-使用Mason开发高性能的W...
分类:
Web程序 时间:
2015-04-03 00:09:28
阅读次数:
299
用python连接中控考勤机。下载并分析数据,把结果邮件给人事。中控SDK包:x32地址x64地址SDK包建议用32位的,在win764位系统上用64位开发包不行,用32可以。python还要pywin32注意版本,我这用的32位的python2.7然后下的这个pywin32#!/usr/bin/envpython
#_*_coding:gbk_*_
im..
分类:
编程语言 时间:
2015-04-02 16:39:59
阅读次数:
1030
# description: 1. 批量转换文件编码,从GBK GB2312编码转换到UTF-8编码
# 2. 支持指定目录下所有的文件的转换,包括子目录中的文件
# 3. 支持检测原始编码,对已经是UTF-8编码的文件,不做转换
# 4. 支持只转换指定扩展名的编码
# 5. 支持多线程转换和控制台输出
# 6. 支持控制台显示线程池的状态
# ...
分类:
编程语言 时间:
2015-04-02 15:09:24
阅读次数:
214
1.当调用静态xml文件时,xml文件格式需保存为gbk,就不会出现乱码 2.当调用动态xml文件时,将文件格式改为utf-8即可。
分类:
其他好文 时间:
2015-04-02 14:59:29
阅读次数:
142
如下脚本创建数据库yourdbname,并制定默认的字符集是utf8。CREATE DATABASE IF NOT EXISTS yourdbname DEFAULT CHARSET utf8 COLLATE utf8_general_ci;如果要创建默认gbk字符集的数据库可以用下面的sql:cr...
分类:
数据库 时间:
2015-04-02 14:42:00
阅读次数:
155