. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d
匹配数字\b 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束[\u4e00-\u9fa5]{2,20} 匹配2-20个汉字* 重复零次或更多次+
重复一次或更多次? 重复零次或一次{n} 重复n...
分类:
其他好文 时间:
2014-05-20 02:38:31
阅读次数:
219
场景:主库DB:utf8字符集备库DB:gbk字符集需求:校验主备数据是否一致,并且修复
校验过程:设置主库连接为utf8,设置备库连接为gbk,分别进行查询,将返回的的结果集按记录逐字段比较。显示结果:原本相同的汉字字符,数据校验认为不一致。
原因分析:对于主库而已,由于建立连接的字符集为UTF8...
分类:
数据库 时间:
2014-05-17 01:10:11
阅读次数:
378
计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。字符集(Charset):是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符编码(Character
Encoding):是一套法则,使...
分类:
其他好文 时间:
2014-05-16 18:18:56
阅读次数:
316
用过AJAX的朋友肯定知道javascript是使用UTF-8国际编码,即每个汉字用3个字节来存储,但是这就造成了用AJAX来send数据的时候出现乱码。有一种解决办法就是使用encodeURIComponent加上修改Content-Type为application/x-www-form-urle...
分类:
其他好文 时间:
2014-05-16 09:45:00
阅读次数:
361
什么是索引拿汉语字典的目录页(索引)打比方:正如汉语字典中的汉字按页存放一样,SQL
Server中的数据记录也是按页存放的,每页容量一般为4K。为了加快查找的速度,汉语字(词)典一般都有按拼音、笔画、偏旁部首等排序的目录(索引),我们可以选择按拼音或笔画查找方式,快速查找到需要的字(词)。同理,S...
分类:
数据库 时间:
2014-05-16 04:34:08
阅读次数:
379
最近一直被solr的搜索困扰,搜索汉字时不能搜索出自己想要的内容,经过研究和查询发现,问题出在没有完全匹配上,主要还是对solr使用不太熟练。解决方法:以前UserRealname:某某家长,这样搜索出使用问题的,改为UserRealname:"某某家长"
外面加上双引号,必须是双引号。就OK了。
分类:
其他好文 时间:
2014-05-15 17:11:34
阅读次数:
260
作者:iamlaosong
一个简单的函数,从包含有数字信息的字符串中取出这个数据,利用VAL函数将字符串转换为数值,该函数或略数字字符串后面的字母和汉字信息,所以,只要把数字前面的字母和汉字信息去掉就行了。
'函数,从字符串“ABC123456.78DEF”中取出数据
Function mydata(mystring As String) As Double
Dim...
分类:
其他好文 时间:
2014-05-15 11:16:23
阅读次数:
448
方法一:根据ASCII码转换,GB2312库对多音字也无能为力。GB2312标准共收录6763个汉字,不在范围内的汉字是无法转换,如:中国前总理朱镕基的“镕”字。GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。01-09区为特殊符号。16-55区为一级汉字,按拼音排序。(3755个)56-87区为二级汉字,按部首/笔画排序。(3008个)10-15区...
分类:
Web程序 时间:
2014-05-15 06:50:21
阅读次数:
590
是SQL Server编排数据的内部方法。它为SQL
Server提供一种方法来编排查询数据什么是索引拿汉语字典的目录页(索引)打比方:正如汉语字典中的汉字按页存放一样,SQL
Server中的数据记录也是按页存放的,每页容量一般为4K。为了加快查找的速度,汉语字(词)典一般都有按拼音、笔画、偏旁部...
分类:
数据库 时间:
2014-05-14 12:46:18
阅读次数:
478