python 字符编码问题总结

时间：2017-12-13 23:36:56 阅读：144 评论：0 收藏：0 [点我收藏+]

都是计算机存储是二进制0101之类的数字最早计算机在美国开始的所以数字和英文之类的占用八位 2的8次方 256可以存储对于英文和数字戳戳有余每个国家都有自己的编码中国 gb2312 gbk gb1803 台湾日本，韩国，都有对于的一张表表示字符，所以后来unicode 统一各国语言，unicode编码统一两位表示字符，英文只有8为，不够位就用0补齐，,这样美国人就不干了，后来发展可以可长可短的utf-8, 其实unicode 和utf8之间什么关系呢， Unicode是一种字符集，而utf-8是一种编码方式。Unicode字符集既可以用utf-8编码方式编成计算机能够识别的二进制数值 UTF-8是Unicode的实现方式之一，传输、存储，GBK也一样 Unicode只是一个符号集，它只规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储。str.encode("utf8") str.decode("gbk")

python 字符编码问题总结

标签：编码开始问题如何表示之一 decode body 自己

原文地址：http://www.cnblogs.com/96net/p/8034312.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行