码迷,mamicode.com
首页 > 其他好文 > 详细

难分难解的字符集ASCII、Unicode、UTF-8 ---- 如果你也感到困惑,赶紧来围观

时间:2014-12-13 18:06:45      阅读:177      评论:0      收藏:0      [点我收藏+]

标签:style   http   io   ar   color   os   sp   on   2014   

闲来无事学习一下Python,在看到关于Python字符类型的时候有提到字符集,字符集的问题我一直没搞明白,ASCII、Unicode、UTF-8之间有什么区别呢?借着这个机会总算是有了一点点的明白,记录下来,学习一下。

谈到字符集的人,肯定是跟计算机打交道的人,由于计算机只能处理数字,没有人类这么超高的智慧,如果计算机需要处理文本,那就必须把文本转换成数字。那么问题来了:如何实现把文本转换成数字这个过程呢?聪明的人类想到了字符集。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),也就是说8位一个字节。所以,一个字节能表示的最大的整数就是255(28-1,二进制数字1111 1111 = 十进制 255),如果要表示更大的数字,就必须采用更多的字节,比如两个字节表示的最大整数是65535(216-1).

由于计算机诞生于美国,因此最初只是把大小写英文字母、数字和一些符号编码到计算机,这个编码就是ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。下面是ASCII编码表,^_^ :

原文地址: Read More >>

难分难解的字符集ASCII、Unicode、UTF-8 ---- 如果你也感到困惑,赶紧来围观

标签:style   http   io   ar   color   os   sp   on   2014   

原文地址:http://blog.csdn.net/ycdijt/article/details/41909699

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!