1.去除字符中,汉字的空格 2.繁体汉字与简体汉字的转换操作 引用ChineseConverter.dll 3. ...
分类:
其他好文 时间:
2017-08-21 15:51:42
阅读次数:
143
Unicode编码则是采用双字节16位来进行编号,可编65536字符,基本上包含了世界上所有的语言字符,它也就成为了全世界一种通用的编码,而且用十六进制4位表示一个编码,非常简结直观,为大多数开发者所接受,特别是十六进制编码后,可以解决汉字在js再编码过程中出现乱码问题,提高解释速度,我们建议在js ...
分类:
其他好文 时间:
2017-08-21 00:31:41
阅读次数:
195
GBK编码范围:8140-FEFE,汉字编码范围见第二节:码位分配及顺序。 GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字( ...
分类:
其他好文 时间:
2017-08-20 16:49:41
阅读次数:
3323
utf-8 编码,一个汉字,三个字节, 一个字节8位,01010101 用一个16进制 Str字节类型与编码 创建字节和字符串 字符列表转化 元祖转化列表 字典转化列表 列表分为自身改变,另外一个生成新的 .extend() #扩折自己,用另外一个可迭代对象, 扩充到自己内部 .reverse () ...
分类:
其他好文 时间:
2017-08-20 15:46:39
阅读次数:
171
GB2312 收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个 每个符号都用两个字节表示,每个字节均采用七位编码表示,习惯上 第一个字节是高字节,第二个字节是低字节 GB2312的编码范围为2121H-777EH,与ASCII有重叠,通行方法是将GB码两个字节的最高位置 ...
分类:
其他好文 时间:
2017-08-19 12:59:21
阅读次数:
570
一、校验数字的表达式 数字:^[0-9]*$ n位的数字:^\d{n}$ 至少n位的数字:^\d{n,}$ m-n位的数字:^\d{m,n}$ 零和非零开头的数字:^(0|[1-9][0-9]*)$ 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$ 带1- ...
分类:
其他好文 时间:
2017-08-17 21:36:00
阅读次数:
213
判断一个字符是不是汉字通常有三种方法: [1] 用 ASCII 码判断;[2] 用汉字的 UNICODE 编码范围判断;[3] 用正则表达式判断。 1、用ASCII码判断 在 ASCII码表中,英文的范围是0-127,而汉字则是大于127,具体代码如下: 2、用汉字的 UNICODE 编码范围判断 ...
ASCII编码是128个字符 中国把汉字编入GB2312,Shift_JIS/Euc-kr各国标准..... Unicode是为了解决各国乱码的,但浪费存储空间 UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6字节,英文字母是1字节,汉字通常是3字节,生僻字符是4-6字节 txt ...
分类:
其他好文 时间:
2017-08-17 00:54:13
阅读次数:
283
匹配中文字符的正则表达式: [\u4e00-\u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^\x00-\xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:\n\s*\r 评注:可 ...
分类:
其他好文 时间:
2017-08-16 21:40:18
阅读次数:
128
长度为8 。 存的时候 原数据库中的中文数据为 一个汉字二个字节。新的数据库 字符集为 al32utf8 中 一个汉字为 三个字节存。 所以,现修改原数据库char类型为原长3倍。 length 取的时候是单个计算取的。 ...
分类:
数据库 时间:
2017-08-16 11:38:03
阅读次数:
245