码迷,mamicode.com
首页 >  
搜索关键字:unicode 和utf-8    ( 5622个结果
搜狐微博的解码方式及常用字符集一些知识.
开通了一个月,还没发一篇文章,今天将最近学到的知识做个总结,发表一下,如有错误请各路大神指正,不喜勿喷!!!搜狐微博msg走的流程(全中文,中英文混合):1、将unicode形式的内容转化成GB18030形式的内容2、将GB18030形式的内容进行utf-8解码msg走的流程(纯英文):直接进行ur...
分类:其他好文   时间:2014-09-18 11:09:23    阅读次数:222
安卓学习-其他-字符串转码工具
import java.io.UnsupportedEncodingException;/** * 转换字符串的编码 */public class ChangeCharset { /** 7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static...
分类:移动开发   时间:2014-09-18 09:39:53    阅读次数:255
[Windows]_[删除非空目录的注意要点]
1. 有时候程序需要生成一些临时目录和临时文件,在程序退出时需要删除,这时候用win32的api即可完成需求,自己遍历目录一个个removefile并不是高效率的做法. //注意: //1.要删除的目录不能以\\结尾.只能以目录名结尾,比如C:\\New Folder,而不是C:\\New Folder\\,不然会失败. //2.pFrom的值必须是以\0结尾的字符串,unicode字符串要以两个\0\0结尾. //3.可以使用std::string或std::wstring的c_str(),因为这个函数返...
分类:Windows程序   时间:2014-09-18 00:51:13    阅读次数:305
vim打开后乱码,xshell打开后也是乱码
Xshell对于嵌入式开发来说,是个非常不错的工具。但或许都有过被中文显示为乱码的问题感觉有点不爽。解决方法其实很简单的,即把xshell编码方式改成UTF-8即可。[文件]–>[打开]–>在打开的session中选择连接的那个,点击[属性] -> [终端],编码选择为:Unicode(UTF-8)...
分类:其他好文   时间:2014-09-17 23:18:52    阅读次数:208
nltk-比较中文文档相似度
nltk同时也能处理中文的场景,只要做如下改动: 使用中文分词器(如我选用了结巴分词) 对中文字符做编码处理,使用unicode编码方式 python的源码编码统一声明为 gbk 使用支持中文的语料库 to be continue......
分类:其他好文   时间:2014-09-17 10:30:22    阅读次数:275
写了个go语言版的chardet包
github.com/hydra13142/chardet 以上就是地址。支持中文编码(hz-gb2312、big5、gbk、gb18030)、韩文编码(euc-kr)、日文编码(shift-jis、euc-jp、iso-2022-jp)和unicode编码(UTF-8、UTF-16BE、UTF-1...
分类:编程语言   时间:2014-09-17 02:28:01    阅读次数:385
CSS中文字体对照表
Unicode简单的说一下制作网页时的为了兼顾到一些浏览器CSS样式文档中一般是不出 现中文字体的,尤其是{}中,因此通过参照下表将其对应转编,可以将中文名转成英文 名、unicode、unicode2注意unicode2是直接输出为文本的, 比如:微软雅黑,我们在CSS中的设置为:1fo...
分类:Web程序   时间:2014-09-16 18:48:10    阅读次数:266
字符集和字符编码(Charset & Encoding)
——每个软件开发人员应该无条件掌握的知识! ——Unicode伟大的创想! 相信大家一定碰到过,打开某个网页,却显示一堆像乱码,如"б?ЯАзЪСЯ"、"?????????"?还记得HTTP中的Accept-Charset、Accept-Encoding、Accept-Language、Conten...
分类:其他好文   时间:2014-09-16 18:41:30    阅读次数:494
UNICODE 7.0定义的表情符
UNICODE 7.0定义了78个表情符,从0x1F600到0x1F64F(其中0x1F643和0x1F644没有定义)。下表中列出了这些表情符,如果第一列CHART没有显示,说明你的浏览器还不支持。参考资料:http://www.unicode.org/Public/7.0.0/charts/Co...
分类:其他好文   时间:2014-09-16 12:06:30    阅读次数:177
Css中常用中文字体的Unicode编码对照
Css中常用中文字体的Unicode编码对照在网页制作中,最常用的恐怕是字体属性了,在调整页面兼容的时候,也常常发现字体名称的原因导致不兼容或乱码,下面给出几种常用字体的ucicode编码对照,方便使用。宋体SimSun\5B8B\4F53黑体SimHei\9ED1\4F53微软雅黑Microsof...
分类:Web程序   时间:2014-09-15 15:30:49    阅读次数:264
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!