问题1:假设我们知道汉字编码范围是0x4E00到0x9FA5,怎么从十六进制的编码转成人类可读的字呢?问题2:怎么把unicode编码的字写入文件呢,如果直接用open()的话,会提示UnicodeEncodeError:‘ascii‘codeccan‘tencodecharacteru‘\u4e00‘inposition0:ordinalnotinrange
分类:
其他好文 时间:
2014-07-20 15:11:21
阅读次数:
233
问题1:假设我们知道汉字编码范围是0x4E00到0x9FA5,怎么从十六进制的编码转成人类可读的字呢?
问题2:怎么把unicode编码的字写入文件呢,如果直接用open()的话,会提示UnicodeEncodeError: 'ascii' codec can't encode character u'\u4e00' in position 0: ordinal not in range(128...
分类:
编程语言 时间:
2014-07-20 10:46:08
阅读次数:
732
ascii是一个字节,但是unicode可不一定就是两个字节. ascii只能表示英文数字和常用标点符号,编码在1-127之间.unicode可以表示所有字符,编码范围很大.ascii 能表示256个符号,低128个是英文 数字 标点 与一些不可显示字符高128个在不同的代码页上会表示不同的内容,就...
分类:
其他好文 时间:
2014-07-13 10:06:32
阅读次数:
248
QString MainWindow::ParseLanguage(QString Text)
{
if(Text.length()<=0)
{
return "";
}
QString sRegNum = "[0-9]+";
QString sRegEn = "[a-zA-Z]+";
QString sRegCn =...
分类:
其他好文 时间:
2014-07-09 10:14:38
阅读次数:
301
以前写过一篇贴子是写中文在unicode中的编码范围 unicode中文范围,但写的不是很详细,今天再次研究了下unicode,并给出详细的unicode取值范围。本次研究的unicode对象是unicode 5.2.0版本。现在最新的是6.0版对于这次研究的unicode把编码分为以下几个平面(英...
分类:
其他好文 时间:
2014-06-25 18:44:35
阅读次数:
601
Latin1Latin1是ISO-8859-1的别名,有些环境下写作Latin-1。ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。ISO-885...
分类:
其他好文 时间:
2014-05-07 02:29:01
阅读次数:
305