今天在用scrapy爬某个网站的数据,其中DOM解析我用的是BeautifulSoup,速度上没有XPath来得快,不过因为用了习惯了,所以一直用的bs,版本是bs4不过在爬取过程中遇到了一些问题,其中一个是Unicode转码问题,这也算是python中一个著名问题了。我遇到的算是Beautiful...
分类:
其他好文 时间:
2014-07-22 22:53:55
阅读次数:
229
如果是tomcat的话 server.xml文件里IE11浏览器不行,谷歌火狐浏览器可以
分类:
其他好文 时间:
2014-07-22 22:51:55
阅读次数:
204
jap:
<%@?page?language="java"?contentType="text/html;?charset=UTF-8"?pageEncoding="UTF-8"%>//都改为utf-8
<meta?http-equiv="Content-Type"?content="text/html;?charset=UTF-8">//utf-8
tomcat...
分类:
其他好文 时间:
2014-07-22 09:10:34
阅读次数:
241
如果你需要在linux下面用到windows下的文件,拷贝上去后经常发现中文显示乱码。。原因是Windows中默认的文件格式是 GBK(gb2312),而Linux一般都是UTF-8。比较繁琐的方法是在windows下用程序把内容转换为utf-8编码...
源地址:http://blog.csdn.net/xcy2011sky/article/details/7168376解决中文乱码,最好知道乱码是什么格式比如说:utf-8.解决方案:1.让整个应用程序支持中文: 在 QApplication a(argc, argv);后加上以下几句话即可。要包含...
分类:
其他好文 时间:
2014-07-22 00:36:35
阅读次数:
192
最近ubuntu 14.04和chrome都升级成最新版后,chrome标题栏和书签栏都不能正常显示中文了。 然后搜了下发现这样可以解决: 修改文件 /etc/fonts/conf.d/49-sansserif.conf? 将其中标红部分修改一个已经安装的中文...
分类:
其他好文 时间:
2014-07-21 10:21:13
阅读次数:
223
数据库中的数据在不同的数据库中转换来装换去,由于不同库可能使用了不同的字符集,所以可能导致结果数据乱码问题。此次是在一个作业中跑数据,跑完数据前台数据显示出现乱码,检查了作业中的多有中间过程表,包括...
分类:
其他好文 时间:
2014-07-21 10:09:15
阅读次数:
473
在学习andriod的过程中,我经常下载查看一些热心网友上传的代码。有的网友会把众多的源码收集起来,供大家参考与学习,非常感谢他们的劳动。在学习的过程中,遇到的2个问题是:1:代码编码的格式不一样,导致在Eclipse里打开的时候,出现乱码。2:每次一个一个压缩包解压太麻烦了。所以我就写了这个小工具...
分类:
其他好文 时间:
2014-07-21 00:26:06
阅读次数:
242
首先,php 与 mysql 要保持编码一致其次,有三处注意点:1.sql 表目 设为 utf8_unicode_ci2.php1 header("Content-Type: text/html; charset=utf8");3.sql1 mysql_query("set names 'utf8'...
分类:
其他好文 时间:
2014-07-21 00:13:37
阅读次数:
222
0. 前言 最近忽然想知道在Javascript引擎中,对于字符串的编码做了哪些处理。因为我稀薄的记忆中,一些比较偏僻的特殊字符,JS是有可能显示成乱码,或者如果你访问其length属性的时候,JS返回的是长度值是2而不是...
分类:
其他好文 时间:
2014-07-20 23:28:21
阅读次数:
406