码迷,mamicode.com
首页 > 其他好文 > 详细

ascii、unicode、utf-8、gbk

时间:2020-06-01 00:31:17      阅读:91      评论:0      收藏:0      [点我收藏+]

标签:最小   转译   比特   状态   存储   版本   ascii码   机器码   字节   

字节码是一种中间状态(中间码)的二进制代码(文件)。需要直译器转译后才能成为机器码。

1字节 = 8 位位(bit),数据存储是以“字节”(Byte)为单位,

数据传输是以大多是以“位”(bit,又名“比特”)为单位,

一个位就代表一个0或1(即一个二进制),

二进制是构成存储器的最小单位,

每8个位(bit,简写为b)组成一个字节(Byte,简写为B),

字节是最小一级的信息单位

utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。

gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。

python2内容进行编码(默认ascii),而python3对内容进行编码的默认为utf-8。

ascii 最多只能用8位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。

unicode 万国码,任何一个字符==两个字节

utf-8 万国码的升级版 一个中文字符==三个字节 英文是一个字节 欧洲的是 2个字节

gbk 国内版本 一个中文字符==2个字节 英文是一个字节

gbk 转 utf-8 需通过媒介 unicode

ascii、unicode、utf-8、gbk

标签:最小   转译   比特   状态   存储   版本   ascii码   机器码   字节   

原文地址:https://www.cnblogs.com/justblue/p/13022470.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!