原文:使用HttpWebRequest和HtmlAgilityPack抓取网页(拒绝乱码,拒绝正则表达式)废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时...
分类:
Web程序 时间:
2014-06-27 20:32:13
阅读次数:
270
中文乱码:在以后学习过程中全部采用UTF-81、文件的乱码1.1、项目文本文件默认编码: 【右击项目】->【Properties】->【Resource】->【Text file encoding】1.2、文件默认编码:默认使用项目的默认编码 【右击文件】->【Properties】->【Reso....
分类:
编程语言 时间:
2014-06-27 16:21:08
阅读次数:
219
1.加头文件#include 2.在文件打开 CStdioFile file; CFileException exp;之后加上: char* old_locale=_strdup(setlocale(LC_CTYPE,NULL) ); setlocale( LC_CTYPE,"chs");3.在文件...
分类:
其他好文 时间:
2014-06-27 13:15:52
阅读次数:
442
作者:郝喜路 个人主页: http://www.cnicode.com 博客地址:http://haoxilu.cnblogs.com 时间:2014年6月26日 19:25:02 刚刚在博客园 看到一篇博文《使用HttpWebRequest和HtmlAgilityPack抓取网页(拒绝乱码...
分类:
Web程序 时间:
2014-06-27 11:38:56
阅读次数:
324
在一般情况下,propertites文件在eclipse中的显示中文一直显示乱码,想要解决这个问题,需要通过在eclipse中安装一个Propertites Editor插件来进行解决。 在Eclipse Marketplace中选择Propertites Editor, 插件安装: 安装后,pro...
分类:
系统相关 时间:
2014-06-26 18:51:20
阅读次数:
276
这次是因为要把一个很久的老项目改成使用Unicode字符集,又一次遇到了LNK 2005错误先说说怎么把老项目改成Unicode字符集吧,首先要有足够的信心能把项目改好,比如我这次改的项目,也不算很大,但是也有好几万行,一改成使用Unicode字符集编译后,瞬间出现上百个错误(VC2010碰到错误太...
分类:
其他好文 时间:
2014-06-26 18:23:29
阅读次数:
118
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:57:58
阅读次数:
373
废话不多说, 直接说需求。公司的网站需要抓取其他网站的文章,但任务没到我这,同事搞了一下午没搞出来。由于刚刚到公司, 想证明下自己,就把活揽过来了。因为以前做过,觉得应该很简单,但当我开始做的时候,我崩溃了,http请求后,得到的是字符串竟然是乱码,然后就各种百度(谷歌一直崩溃中),最后找到了原因。...
分类:
Web程序 时间:
2014-06-26 12:53:48
阅读次数:
232
《libiconv字符集转换库使用方法》一文中说到了libiconv可以实现不同字符集的转换。比如GBK转BIG5等。在项目中因为需要,找到这个库。可是这个库在C#中没有很好的支持。不过,想着既然是C++的库,那只要动态加载DLL的接口就好了。可是调用并不顺利,传进去的IntPtr或者byte数组总是拿不到数据。后面回到了C++的方式去调用,几经调试,总算找到了原因。
是iconv接口在转换完成...
分类:
其他好文 时间:
2014-06-26 11:50:38
阅读次数:
353