正则表达式就是由一系列特殊字符组成的字符串, 其中每个特殊字符都被称为元字符。一个正则表达式会包含下列一项或多项:1. 一个字符集. 这里所指的字符集只包含普通字符, 这些字符只表示它们的字面含义. 正则表达式的最简单形式就是只包含字符集, 而不包含元字符.2. 锚. 锚指定了正则表达式所要匹配的文...
分类:
其他好文 时间:
2014-08-21 11:27:13
阅读次数:
238
char :单字节变量类型,表示ASCII码。wchar_t :宽字节变量类型,用于表示Unicode字符。在定义为:typedef unsigned short wchar_t。TCHAR: VS下的中间类型。在“使用Unicode字符集”下TCHAR定义为wchar_t,在字符集 “未设置” 条...
分类:
其他好文 时间:
2014-08-21 09:37:03
阅读次数:
257
书籍《fonts and encodings》只找到英文版 许令波的《深入分析Java Web技术内幕》3.3节文章字符编码笔记:ASCII,Unicode和UTF-8谈谈Unicode编码UNICODE,GBK,UTF-8区别Unicode字符集和多字节字符集关系谈谈Unicode编码,简要解释....
分类:
其他好文 时间:
2014-08-20 21:03:52
阅读次数:
268
存储肯定是二进制存储,同一个字符(汉子)在不同的字符集下有对应的值,一个字符集相当于一个密码表,键名为字符,键值为二进制数(可表示为十进制,十六进制)UTF8是一个unicode字符集的编码规则,也可以看做是根据unicode字符集根据一个规则计算出的另一个字符集。但是从字符集的原始含义区分来说,u...
分类:
其他好文 时间:
2014-08-20 17:55:32
阅读次数:
225
iconv命令实现linux下字符集编码的转换windows下的文件复制到linux下时常会乱码,因为windows下文件编码为GBK,linux下默认文件编码为UTF-8,故需要libiconv库转码。1.iconv命令用法如下:iconv [选项...] [文件...]输入/输出格式规范:-f,...
分类:
系统相关 时间:
2014-08-20 15:52:42
阅读次数:
270
#!/bin/bash#不配置字符集,脚本放到crontab里发出的中文E-MAIL乱码export LANG=en_US.UTF-8#有点强迫症,习惯什么东西在什么地方干 ^_^cd /home/zabbix/graph#保存cookie文件名COOKIE=zbx_cookie.txt> $COO...
分类:
其他好文 时间:
2014-08-20 12:11:12
阅读次数:
329
1.设置Options->SessionOptions ->Emulation,然后把Terminal类型改成xterm,并点中ANSI Color复选框。2.字体设置:Options->SessionOptions->Appearance->font然后改成你想要的字体就可以了。注意:1:字符集选...
分类:
其他好文 时间:
2014-08-19 22:22:35
阅读次数:
354
写代码时需要注意下面两点:
1、源码用 utf-8 字符集
2、源码中需要翻译的字符串必须用英文(不能有中文或其它语言),则需要用 tr()。
例如:
QMessageBox::information(this,
tr("Information"),
tr("Hello world."));...
分类:
其他好文 时间:
2014-08-19 16:43:25
阅读次数:
183
C字符串有3种编码模式,并对应3种字符类型。 (1)单字节字符集(single-byte character set (SBCS)). -在这种编码模式下,所有的字符都只用一个字节(Byte)标示。 -ASCII是SBCS,用一个字节标示为'\0'的来标识SBCS字符串的结束 -单字节字符包含拉丁文...
分类:
编程语言 时间:
2014-08-19 16:16:14
阅读次数:
228
对于使用者来说,一般推荐使用utf8编码来存储数据。而要解决乱码问题,不单单是MySQL数据的存储问题,还和用户的程序文件的编码方式、用户程序和MySQL数据库的连接方式都有关系。首先,MySQL有默认的字符集,这个是安装的时候确定的,在编译MySQL的时候可以通过DEFAULT_CHARSET=u...
分类:
数据库 时间:
2014-08-18 18:18:42
阅读次数:
216