码迷,mamicode.com
首页 > Web开发 > 详细

在获取网页时半角全角字符混合的问题

时间:2015-05-16 23:25:16      阅读:251      评论:0      收藏:0      [点我收藏+]

标签:dotnet 半角 全角 webclie

   在获取网页数据时,遇到一个问题。获取的数据在解析成中文时由于字符中包含半角和全角的字符,总是不能全部显示正确。一开始总想有什么解析方法可以用来处理这种数据。网页本身是utf-8格式,按理来说不应该有这个问题。后来发现是Dotnet中WebClient类默认会将中文转成gb2312。此时与原始的utf-8的数据相比,数据已有丢失,所以我判断再怎么恢复也不行(但不确定)。那WebClient有该属性配置么?果然!将Encoding属性设为utf-8就从头上解决了这个问题。回想之前在用扫码仪获取二维码中文时也遇到这个问题,也许也有相应的解决方法。

在获取网页时半角全角字符混合的问题

标签:dotnet 半角 全角 webclie

原文地址:http://blog.csdn.net/samwell/article/details/45772323

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!