检测攻击,用的 都是ASCII可表示的可见字符,所以unicode对这些字符编码都是一样的,不同的是各个语言,所以我们解码就简单了:只是针对%uxxxx (%u00xx 和 %uFFxx)全角数字(0-9) uFF10 - uFF19全角大文字(A-Z): uFF21 - uFF3A全角小文字(a-...
                            
                            
                                分类:
其他好文   时间:
2014-07-16 22:57:37   
                                阅读次数:
300
                             
                    
                        
                            
                            
                                转自:http://www.cnblogs.com/LinuxHunter/archive/2013/01/06/2848293.html#include #include #include const std::string ws2s( const std::wstring& src ){	std...
                            
                            
                                分类:
编程语言   时间:
2014-07-16 21:07:38   
                                阅读次数:
261
                             
                    
                        
                            
                            
                                在软件的编码和实现中,我们可能会碰到个一个比较头疼的问题--编码,不同字符间的编码和解码,你确定了解各种字符的编码吗?一个朋友问到了我这个问题,我虽然能回答一两个出来,但是感觉已经有点模糊,混乱了,在网上搜了搜,在书上翻了翻,总结一下吧。首先按照字符编码的历程来看:1. ASCII我们需要了解的.....
                            
                            
                                分类:
其他好文   时间:
2014-07-11 23:58:06   
                                阅读次数:
377
                             
                    
                        
                            
                            
                                FileStream fs1 = new FileStream(folder + strPath, FileMode.Open); byte[] bytes = new byte[fs1.Length]; fs1.Read(byte...
                            
                            
                                分类:
其他好文   时间:
2014-07-11 11:07:59   
                                阅读次数:
213
                             
                    
                        
                            
                            
                                import java.io.UnsupportedEncodingException;/*** 转换字符串的编码*/public class ChangeCharset {/**7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块*/public static final...
                            
                            
                                分类:
编程语言   时间:
2014-07-07 14:57:37   
                                阅读次数:
266
                             
                    
                        
                            
                            
                                Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF...
                            
                            
                                分类:
其他好文   时间:
2014-07-06 22:53:28   
                                阅读次数:
285
                             
                    
                        
                            
                            
                                基础知识
计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通俗的说,按照何种规则将字符存储在计算机中,如'a'用什么表示,称为"编码";反之,将存储在计算机中的二进制数解析显示出来,称为"解码",如同密码学中的加密和解密。在解码过程中,如果使用了错误的解码规则,则导致'a'解析成'b'或者乱码。
字符集(Charset):是一个系统...
                            
                            
                                分类:
其他好文   时间:
2014-07-06 12:00:12   
                                阅读次数:
202
                             
                    
                        
                            
                            
                                在GNU Linux中查看当前文件的编码方式:
可以通过vim打开此文件后在控制模式时输入  
:set fileencoding  可以查看到当前文件的字符编码格式,会在vim窗口下方显示如下内容:
 fileencoding=utf-8 
上行的意思即是此文件的字符编码为utf-8;
那么如何转换一个文件的字符编码呢?
可以使用iconv 命令进行处理,...
                            
                            
                                分类:
系统相关   时间:
2014-07-04 07:24:43   
                                阅读次数:
338
                             
                    
                        
                            
                            
                                我们知道,python中的字符串分普通字符串和unicode字符串,一般从数据库中读取的字符串会自动被转换为unicode字符串下面回到重点,使用json.dumps时,一般的用法为:>>> obj={"name":"测试"}>>> json.dumps(obj)'{"name": "\\u6d4b...
                            
                            
                                分类:
编程语言   时间:
2014-07-03 06:51:34   
                                阅读次数:
544
                             
                    
                        
                            
                            
                                在使用PHP处理字符串时,我们经常会碰到字符编码转换的问题,你碰到过iconv转换失败吗?发现问题时,网上搜了搜,才发现iconv原来有bug ,碰到一些生僻字就会无法转换,当然了配置第二个参数时,可以稍微弥补一下默认缺陷,不至于无法转换是截断,用法如下iconv(“UTF-8″,”GB2312//...
                            
                            
                                分类:
Web程序   时间:
2014-06-30 22:08:40   
                                阅读次数:
282