汉字在 Unicode 的区间为:[\u4e00-\u9fa5]常用汉字Unicode编码:\u7684\u4e00\u4e86\u662f\u6211\u4e0d\u5728\u4eba\u4eec\u6709\u6765\u4ed6\u8fd9\u4e0a\u7740\u4e2a\u5730\u...
分类:
其他好文 时间:
2014-09-04 23:33:30
阅读次数:
459
应用程序中的编码问题让人头疼,一直是这样,今天下午就被数据库编码错误搞的头疼不已。
那么,就决心好好总结一下编码带来的问题,争取让自己对整个编码体系有一个清晰的认识。
从编码问题的产生说起
我们知道,计算机是美国人发明的,人家的英语体系总从来就只有26个英文字母和一些数字、特殊字符等,为了储存文字信息,于是使用了最早的ascii码进行字符编码。而后来由于计算机的普及,多国语言...
分类:
其他好文 时间:
2014-09-04 22:23:00
阅读次数:
364
主要注意的一个问题是:std::string 实际是类似一个 vector的结构。 它里面是可以存放 ascii为0 的字符不算结尾 (否则 unicode方式的编码存放就有问题) 实际长度 用 length()获取 至于string赋值和构造有好几种方式,可以看文档。 举例说明:char c[10...
分类:
其他好文 时间:
2014-09-04 20:51:00
阅读次数:
167
* 分类排序:中文名+英文名+Unicode+Unicode 2Windows平台新细明体 PMingLiU \65B0\7EC6\660E\4F53 新细明体细明体 MingLiU \7EC6\660E\4F53 细明体标楷体 DFKai-SB \6807\6977\4F53 标楷体黑体 SimH...
分类:
Web程序 时间:
2014-09-04 18:31:39
阅读次数:
294
关于软件系统漏洞的问题,其中最常见的一个是跨站脚本漏洞,网上有很多相关的资料。
突发奇想,怎么能将写好的攻击代码转为Unicode编码后,进行攻击呢?明文攻击很容易被拦截,但是转义后则成功的概率比较大。
但是网上的资料,都是介绍攻击的原理,很少有说怎么将攻击代码转为Unicode编码,以下是同事写的一个小方法,供大家写拦截功能时,测试用。
不建议使用该代码做非法勾当!后果自负。
packa...
分类:
其他好文 时间:
2014-09-04 15:04:09
阅读次数:
142
ios程序中不识别读取到的JSON数据中 \u开头的数据。PHP 生成JSON的时候,必须将汉字不转义为 \u开头的UNICODE数据。网上非常多,可是事实上都是错误的,正确的方法是在json_encode 中添?一个參数 JSON_UNESCAPED_UNICODE (by default7#zb...
分类:
Web程序 时间:
2014-09-03 19:40:27
阅读次数:
204
1 function replace_unicode_escape_sequence($match) { 2 return mb_convert_encoding(pack('H*', $match[1]), 'UTF-8', 'UCS-2BE'); 3 } 4 $name = '\u65b0\u....
分类:
Web程序 时间:
2014-09-03 11:03:36
阅读次数:
230
在Django视图函数中经常出现类似于‘ascii‘ codec can‘t decode byte 0xef in position 0: ordinal not in range(128)的错误。 在解决错误之前,首先要了解unicode和utf-8的区别。 unicode指的是万国码,是一种“字...
分类:
其他好文 时间:
2014-09-02 18:16:55
阅读次数:
141
正式内容開始之前,我们先来了解一个基本概念,编码字符集。 编码字符集:编码字符集是一个字符集,它为每个字符分配一个唯一数字。Unicode 标准的核心是一个编码字符集,字母“A”的编码为 004116 和字符“”的编码为 20AC16。Unicode 标准始终使用十六进制数字,并且在书写时在前面加...
分类:
其他好文 时间:
2014-09-02 15:25:04
阅读次数:
257