开通了一个月,还没发一篇文章,今天将最近学到的知识做个总结,发表一下,如有错误请各路大神指正,不喜勿喷!!!搜狐微博msg走的流程(全中文,中英文混合):1、将unicode形式的内容转化成GB18030形式的内容2、将GB18030形式的内容进行utf-8解码msg走的流程(纯英文):直接进行ur...
分类:
其他好文 时间:
2014-09-18 11:09:23
阅读次数:
222
import java.io.UnsupportedEncodingException;/** * 转换字符串的编码 */public class ChangeCharset { /** 7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static...
分类:
移动开发 时间:
2014-09-18 09:39:53
阅读次数:
255
1. 有时候程序需要生成一些临时目录和临时文件,在程序退出时需要删除,这时候用win32的api即可完成需求,自己遍历目录一个个removefile并不是高效率的做法.
//注意:
//1.要删除的目录不能以\\结尾.只能以目录名结尾,比如C:\\New Folder,而不是C:\\New Folder\\,不然会失败.
//2.pFrom的值必须是以\0结尾的字符串,unicode字符串要以两个\0\0结尾.
//3.可以使用std::string或std::wstring的c_str(),因为这个函数返...
Xshell对于嵌入式开发来说,是个非常不错的工具。但或许都有过被中文显示为乱码的问题感觉有点不爽。解决方法其实很简单的,即把xshell编码方式改成UTF-8即可。[文件]–>[打开]–>在打开的session中选择连接的那个,点击[属性] -> [终端],编码选择为:Unicode(UTF-8)...
分类:
其他好文 时间:
2014-09-17 23:18:52
阅读次数:
208
nltk同时也能处理中文的场景,只要做如下改动: 使用中文分词器(如我选用了结巴分词) 对中文字符做编码处理,使用unicode编码方式 python的源码编码统一声明为 gbk 使用支持中文的语料库 to be continue......
分类:
其他好文 时间:
2014-09-17 10:30:22
阅读次数:
275
github.com/hydra13142/chardet 以上就是地址。支持中文编码(hz-gb2312、big5、gbk、gb18030)、韩文编码(euc-kr)、日文编码(shift-jis、euc-jp、iso-2022-jp)和unicode编码(UTF-8、UTF-16BE、UTF-1...
分类:
编程语言 时间:
2014-09-17 02:28:01
阅读次数:
385
Unicode简单的说一下制作网页时的为了兼顾到一些浏览器CSS样式文档中一般是不出 现中文字体的,尤其是{}中,因此通过参照下表将其对应转编,可以将中文名转成英文 名、unicode、unicode2注意unicode2是直接输出为文本的, 比如:微软雅黑,我们在CSS中的设置为:1fo...
分类:
Web程序 时间:
2014-09-16 18:48:10
阅读次数:
266
——每个软件开发人员应该无条件掌握的知识! ——Unicode伟大的创想! 相信大家一定碰到过,打开某个网页,却显示一堆像乱码,如"б?ЯАзЪСЯ"、"?????????"?还记得HTTP中的Accept-Charset、Accept-Encoding、Accept-Language、Conten...
分类:
其他好文 时间:
2014-09-16 18:41:30
阅读次数:
494
UNICODE 7.0定义了78个表情符,从0x1F600到0x1F64F(其中0x1F643和0x1F644没有定义)。下表中列出了这些表情符,如果第一列CHART没有显示,说明你的浏览器还不支持。参考资料:http://www.unicode.org/Public/7.0.0/charts/Co...
分类:
其他好文 时间:
2014-09-16 12:06:30
阅读次数:
177
Css中常用中文字体的Unicode编码对照在网页制作中,最常用的恐怕是字体属性了,在调整页面兼容的时候,也常常发现字体名称的原因导致不兼容或乱码,下面给出几种常用字体的ucicode编码对照,方便使用。宋体SimSun\5B8B\4F53黑体SimHei\9ED1\4F53微软雅黑Microsof...
分类:
Web程序 时间:
2014-09-15 15:30:49
阅读次数:
264