码迷,mamicode.com
首页 > 其他好文 > 详细

字节和字符的区别 【转】

时间:2017-06-27 00:57:45      阅读:174      评论:0      收藏:0      [点我收藏+]

标签:文字   英文字母   转换   不能   定义   bytes   设置   空间   大小写   

(一)“字节”的定义
字节(Byte)是一种计量单位,表示数据量多少,它是计算机信息技术用于计量存储容量的一种计量单位。

(二)“字符”的定义
字符是指计算机中使用的文字和符号,比如1、2、3、A、B、C、~!·#¥%……—*()——+、等等。

(三)“字节”与“字符”
它们完全不是一个位面的概念,所以两者之间没有“区别”这个说法。不同编码里,字符和字节的对应关系不同:
①ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。
②UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
③Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。
④UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。
⑤UTF-32编码中,世界上任何字符的存储都需要4个字节。

==============================================================================
package com.suypower.chengyu.test;

public class ByteTest {

 /**
  * byte 8 bits -128 - + 127
  * 1 bit = 1 二进制数据
  * 1 byte = 8 bit
  * 1 字母 = 1 byte = 8 bit(位)
  * 1 汉字 = 2 byte = 16 bit
  */
 public static void main(String[] args) {
  // TODO Auto-generated method stub
  byte b1 = 127;
  byte b2 = -128;
  byte b3 = ‘a‘;
  byte b4 = ‘A‘; // 一个字母 = 1 byte = 8 bit
//  byte b5 =‘aa‘;  这就错了
//  byte b6 =‘中‘; 这就错了 一个汉字 2个字节 16bit
  short s1 = ‘啊‘; // 一个汉字 2个字节 16bit short 是 16 bit位的
//  short s2 = ‘汉字‘;  // 2个汉字 4个字节 32 bit int 是32 bit的
//  int i1 = ‘汉字‘;  但是 int 是数字类型的 , char 是 16 bit的 = 2 byte = 一个汉字
  char c1 = ‘汗‘;
//  byte 转换 string
  String string = "中文";
  byte by[] = string.getBytes();
  String str = new String(by);
  System.out.println("str="+str);
 }

}
==================================================================================

[Java-原创] bit、byte、位、字节、汉字、字符
bit、byte、位、字节、汉字的关系


        1 bit     = 1  二进制数据
        1 byte  = 8  bit
        1 字母 = 1  byte = 8 bit
        1 汉字 = 2  byte = 16 bit


1. bit:位
    一个二进制数据0或1,是1bit;

2. byte:字节
    存储空间的基本计量单位,如:MySQL中定义 VARCHAR(45)  即是指 45个字节;
    1 byte = 8 bit

3. 一个英文字符占一个字节;
    1 字母 = 1 byte = 8 bit

4. 一个汉字占2个字节;
    1 汉字 = 2 byte = 16 bit

5. 标点符号
    A>.  汉字输入状态下,默认为全角输入方式;
    B>.  英文输入状态下,默认为半角输入方式;

    C>.  全角输入方式下,标点符号占2字节;
    D>.  半角输入方式下,标点符号占1字节;

    故:汉字输入状态下的字符,占2个字节 (但不排除,自己更改了默认设置);
            英文输入状态下的字符,占1个字节 (但不排除,自己更改了默认设置);

 

        老美在发明电脑时,肯定以自己的英文字母--即他们自认为的字符为最小的存储计量单位,于是也就有了不规范的1字符=1byte, 岂不知还有我们伟大的汉字计量单
  位,NND,一个汉字也是一个字符,我们的1汉字字符就等于2byte,后来,他们可能意识到这个尴尬的问题,于是又标榜为:一个字母为一个标准字符,去球吧,谁
  整天没事说个字符还“标准字符”,所以啊,个人认为:字符,不能用于标准的计量单位。

字节和字符的区别 【转】

标签:文字   英文字母   转换   不能   定义   bytes   设置   空间   大小写   

原文地址:http://www.cnblogs.com/efforts-will-be-lucky/p/7083039.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!