1.修改字符编码,全部修改为gbk。show variables like '%char%';set character_set_database=gbk;其中,character_set_client为客户端编码方式;character_set_connection为建立连接使用的编码;chara...
分类:
数据库 时间:
2014-11-05 01:53:22
阅读次数:
255
转自本人博客:xge技术博客
http://www.xgezhang.com/char_encodind_vim.html
关于字符编码的问题在做项目的时候经常都会出现,但一直没有很系统的研究过,今天早上系统的看了几篇文章。在此整理分享以下。
三种编码方式的简介:
gb2312(又称为GB 2312-80)编码是一个简体中文字符集的中国国家标准,全称为《信息交换用汉...
分类:
系统相关 时间:
2014-11-04 19:45:27
阅读次数:
322
当我们在使用Window操作系统的时候,可能使用最多的文本格式就是txt了,但是当我们将Window平台下的txt文本文档拷贝到Linux平台下查看时,发现原来的中文全部变成了乱码。没错, 引起这个结果的原因就是两个平台下,编辑器对默认的编码格式是不一样的:
在Window平台下,Notepad的默认编码是ASCII码或者GBK,而在Linux平台下默认的是UTF-8(中文环境的情况),编码...
分类:
系统相关 时间:
2014-11-02 18:21:20
阅读次数:
211
建库语句create db test on D: using codeset GBK territory CNcodeset 和 territory 都是需要指定建表语句CREATE TABLE "测试"."测试" ( "测试" VARCHAR(20) )
分类:
数据库 时间:
2014-11-02 17:53:11
阅读次数:
211
包含单选框、多选框、session的应用,页面自己主动跳转,中文乱码的处理,入门级对于中文乱码的处理,注意几点:注冊页面数据提交方式为post不能忘了写,页面编码方式为gbk,处理提交信息的doRegister.jsp要加request.setCharacterEncoding("gbk");一定要...
分类:
Web程序 时间:
2014-11-02 10:36:28
阅读次数:
187
系统默认是System codepage,我们要选用Custom codepage。值得注意的是,这里只能填写数字,如果你想要utf-8编码,不能直接写utf-8,而是写65001来表示utf-8编码。其他如CodePage=936代表简体中文GBK、CodePage=950代表繁体中文BIG5.
1.strlen()和mb_strlen()的作用分别是什么?strlen()和mb_strlen()的作用都是来获取字符串的长度,其中strlen()只针对单字节编码字符,也就是计算字符串的总字节数,如果是多字节编码,如gbk和utf8,使用strlen()获得的不是字符总数而是总字节数,可以使用...
分类:
Web程序 时间:
2014-10-30 22:35:21
阅读次数:
300
1 #!/usr/bin/env python 2 #encoding=gbk 3 import os 4 import sys 5 6 G_ENCODING="gbk" 7 """ 8 =============================== 9 中文分词 10 1. ...
分类:
编程语言 时间:
2014-10-30 18:38:30
阅读次数:
228
Sublime Text 2中文显示乱码该怎么解决呢?其实解决问题的关键在于让Sublime Text 2支持GB2312和GBK。具体的步骤如下: 1、安装Sublime Package Control。 在Sublime Text 2上用Ctrl+~打开控制台并在里面输入以下...
分类:
其他好文 时间:
2014-10-30 08:19:13
阅读次数:
145
GB2312(1980年)定义,包含6763个汉字,682个字符GBK1.0 定义了21003个汉字,21886个字符ASCII->GB2312->GBK 编码方式向后兼容,即同一个字符在这些编码方案中总是有相同的编码,只是越到后面支持的字符更多区分中文编码的方法是高字节的最高位不为0(@todo)...
分类:
其他好文 时间:
2014-10-30 01:39:36
阅读次数:
194