原文:使用HttpWebRequest和HtmlAgilityPack抓取网页(拒绝乱码,拒绝正则表达式)废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时...
分类:
Web程序 时间:
2014-06-27 20:32:13
阅读次数:
270
中文乱码:在以后学习过程中全部采用UTF-81、文件的乱码1.1、项目文本文件默认编码: 【右击项目】->【Properties】->【Resource】->【Text file encoding】1.2、文件默认编码:默认使用项目的默认编码 【右击文件】->【Properties】->【Reso....
分类:
编程语言 时间:
2014-06-27 16:21:08
阅读次数:
219
1.加头文件#include 2.在文件打开 CStdioFile file; CFileException exp;之后加上: char* old_locale=_strdup(setlocale(LC_CTYPE,NULL) ); setlocale( LC_CTYPE,"chs");3.在文件...
分类:
其他好文 时间:
2014-06-27 13:15:52
阅读次数:
442
作者:郝喜路 个人主页: http://www.cnicode.com 博客地址:http://haoxilu.cnblogs.com 时间:2014年6月26日 19:25:02 刚刚在博客园 看到一篇博文《使用HttpWebRequest和HtmlAgilityPack抓取网页(拒绝乱码...
分类:
Web程序 时间:
2014-06-27 11:38:56
阅读次数:
324
过滤器和包装类设计模式的应用
过滤器高级案例:中文乱码过滤器;脏话过滤器;HTML特殊标记过滤器...
分类:
其他好文 时间:
2014-06-27 08:59:35
阅读次数:
320
前天辛苦用了一天时间,写完关键代码后。用 git 提交,由于修改的东东较多,用一个文件保存了修改的注释,用于 git commit -F commit.txt 。由于是在 windows 平台,所以这个文件是用的 gbk 编码。所以提交后,用 git log 查看日志时,出现乱码。此时就想用 git rebase -i HEAD~1 来修改注释。在选择命令时,用了 x ,进行命令行后,我直接 gi...
分类:
其他好文 时间:
2014-06-27 07:59:57
阅读次数:
213
今天用Xshell 连接CentOS6.5,当终端》编码设置为:Unicode(UTF-8)时,执行service iptables restart命令的输出就会乱码;当编码设置为:默认语言时,ls的输出就会乱码!乱码问题如下图:执行locale命令输出结果如下:LANG=zh_CN.GB18030
LC_CTYPE="zh_CN.GB18030"
LC_NUMERIC="zh_CN.GB1803...
分类:
其他好文 时间:
2014-06-27 07:33:57
阅读次数:
310
随着各种ERP系统的使用,各种企业报表,文件,数据的导出,难免会遇到文件编码不兼容的问题,打开的文件全部是乱码,怎么处理?今天在工作中碰到一例从国税系统导出来的数据,全部是乱码,2个用户,在另一个用户的计算机上没啥问题,在第二个用户计算机上就会存在乱码。很诧异。..
分类:
其他好文 时间:
2014-06-27 07:03:06
阅读次数:
181
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:53:48
阅读次数:
232