码迷,mamicode.com
首页 > 其他好文 > 详细

ASCII、Unicode和UTF-8编码的区别;中英文混合截取

时间:2017-08-17 00:54:13      阅读:283      评论:0      收藏:0      [点我收藏+]

标签:乱码   使用   www   类型   修改   需要   unicode   设置   方便   

ASCII编码是128个字符

中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准.....

Unicode是为了解决各国乱码的,但浪费存储空间

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6字节,英文字母是1字节,汉字通常是3字节,生僻字符是4-6字节

  

txt文本文档为什么有时打开是一堆乱码?

1:编码方式由ASCII码和Unicode码
其中Unicode码包括UTF-8,UTF-16,UTF-32三种,其中UTF-8是变长码,
由于解码错误,导致了打开错误
你可以使用RTF(写字板)或者Word等软件打开
2:源文件根本就不是文本文件,有些人出于保密或者网络传输方便(有些网络传输对格式有明确限制,所以需要修改扩展名)把源文件的扩展名改成了txt
扩展名:文件名中最后的一个“.”之后的名字,用来表明文件类型,帮助设置默认程序

ASCII、Unicode和UTF-8编码的区别;中英文混合截取

标签:乱码   使用   www   类型   修改   需要   unicode   设置   方便   

原文地址:http://www.cnblogs.com/zuochanzi/p/7376464.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!