码迷,mamicode.com
首页 >  
搜索关键字:中文字符    ( 1480个结果
【转】mysql中文乱码的一点理解
我们自己鼓捣mysql时,总免不了会遇到这个问题:插入中文字符出现乱码,虽然这是运维先给配好的环境,但是在自己机子上玩的时候咧,总得知道个一二吧,不然以后如何优雅的吹牛B。 如果你也遇到了这个问题,咱先不谈原因,在PC自带的cmd中(或者是mysql安装版安装后的Command Line客户端,又....
分类:数据库   时间:2015-03-02 18:43:08    阅读次数:206
python中编码总结:
python中编码总结: 1 python默认使用程序文件的编码对中文字符串进行编码,所以utf-8 、gbk程序的记录的中文是不同的编码 2 可以强制使用unicode编码进行编码,使用u字符 3. utf-8 每个中文占用3个字节 \xe8\x80\x83 4 gbk 每个中文占用2个字节  \xbf\xbc 5 编码介绍 编码规则...
分类:编程语言   时间:2015-02-28 16:26:15    阅读次数:213
vi/vim显示中文字符并且去掉^M的方法
vim上经常会碰到中文显示不正常的现象,也就是传说中的乱码。搜索了一下,在 http://www.chinalinuxpub.com/bbs/showthread.php?t=45475 找到了一个解决办法。但是gbk编码的正常了,utf8的又不对了。于是稍微改了一点。 用户目录下创建.vimrc文...
分类:系统相关   时间:2015-02-28 16:12:48    阅读次数:196
request、response 中文乱码问题与解决方式
request乱码指的是:浏览器向服务器发送的请求参数中包含中文字符,服务器获取到的请求参数的值是乱码;response乱码指的是:服务器向浏览器发送的数据包含中文字符,浏览器中显示的是乱码;乱码产生的原因:不管是request乱码还是response乱码,其实都是由于客户端(浏览器)跟服务器端采用...
分类:其他好文   时间:2015-02-26 22:51:47    阅读次数:125
常用正则表达式
匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:\n\s*\r评注:可以用来删除...
分类:其他好文   时间:2015-02-26 21:30:46    阅读次数:151
中文分词器的总结
0 —— Lucene & Nutch是一种神奇的东西,包含了语义分析,自然语言处理,中文分析,网络爬取,索引建立,html解析等,下面介绍几种常用的中文分词工具 1 —— StandardAnalyzer标准分析器,能够根据空格、符号、数字、字母、E-mail地址、IP地址以及中文字符的分析处理分割原始的文本信息,还可以支持过滤词表,用来替代StopAnalyzer能够完成的过滤功能。...
分类:其他好文   时间:2015-02-23 13:11:29    阅读次数:156
Python2.x中文乱码问题
Python中乱码问题是一个很头痛的问题。 在Python3中,对中文进行了全面的支持,但在Python2.x中需要进行相关的设置才能使用中文。否则会出现乱码 【问题原因】 在Python2.x中主要是字符编码的问题,处理不好的话,会导致乱码。Python默认采取的ASCII编码,字母、标点和其他字符只使用一个字节来表示,但对于中文字符来说,一个字节满足不了需求。...
分类:编程语言   时间:2015-02-23 09:38:58    阅读次数:193
【计算机概论】数据表示方式与软件程序运行
数据表示方式数字系统本质即二进制与十进制的相互转换。文字编码系统常用的英文编码表为ASCII系统,这个编码系统中,每个符号(英文,数字或符号等)都会占用1B的记录。 中文当中的编码系统最常用的是big5(简体是GB2312)编码表。每个中文字符占用2B。 为了解决某些生僻字被识别成乱码的问题,由国际组织ISO/IEC指定了所谓的Unicode编码系统,即UTF8或统一码,从而打破了所有国家的不同...
分类:其他好文   时间:2015-02-21 19:57:02    阅读次数:198
JSP页面字符的转码
jsp中,在接受request的中文字符时,显示出来的是乱码,jsp中含客户提交的含有汉字的数据,要采用特殊的处理方式,先将得到的字符串用iso-8859-1编码,并放到一个字节数组中,再用String类的构造函数将其转换为字符串对象,例如,下面的student的Name是ISO-8859-1的,要...
分类:Web程序   时间:2015-02-16 20:59:34    阅读次数:411
MSSql数据类型
nchar : 适用于西文字符,一个字符占一个字节。char: 可以中文,一个字符占两个字节。var :可变。varchar、nvarchar 。所以一般来说,如果含有中文字符,用nchar/nvarchar,如果纯英文和数字,用char/varchar。
分类:数据库   时间:2015-02-15 16:31:37    阅读次数:154
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!