码迷,mamicode.com
首页 > 编程语言 > 详细

python 字符编码问题总结

时间:2017-12-13 23:36:56      阅读:144      评论:0      收藏:0      [点我收藏+]

标签:编码   开始   问题   如何   表示   之一   decode   body   自己   

都是计算机存储是二进制0101之类的数字 最早计算机在美国开始的 所以数字和英文之类的占用八位 2的8次方 256可以存储对于英文和数字戳戳有余  每个国家都有自己的编码 中国 gb2312 gbk gb1803 台湾 日本,韩国,都有对于的一张表表示字符,所以后来unicode 统一各国语言,unicode编码 统一两位表示字符,英文只有8为,不够位就用0补齐 ,,这样美国人就不干了,后来发展可以可长可短的utf-8, 其实unicode 和utf8之间什么关系呢, Unicode是一种字符集,而utf-8是一种编码方式。Unicode字符集既可以用utf-8编码方式编成计算机能够识别的二进制数值   UTF-8是Unicode的实现方式之一,传输、存储,GBK也一样  Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储 。str.encode("utf8")  str.decode("gbk")

python 字符编码问题总结

标签:编码   开始   问题   如何   表示   之一   decode   body   自己   

原文地址:http://www.cnblogs.com/96net/p/8034312.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!