开源数据库 H2, HSQLDB, DERBY, PostgreSQL, MySQL区别/对比图表浪天涯博主翻译:referential integrity 参考完整性transactions 事物unicode 统一码interface 命令 界面 接口data size db limit 数.....
分类:
数据库 时间:
2014-06-27 21:03:21
阅读次数:
519
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-06-26 00:11:42
阅读次数:
259
Java判断一个字符串是否有中文一般情况是利用Unicode编码(CJK统一汉字的编码区间:0x4e00–0x9fbb)的正则来做判断,但是其实这个区间来判断中文不是非常精确,因为有些中文的标点符号比如:,。等等是不能识别的。以下是比较完善的判断方法:CharUtil.javahttp://www....
分类:
编程语言 时间:
2014-06-25 19:10:56
阅读次数:
303
以前写过一篇贴子是写中文在unicode中的编码范围 unicode中文范围,但写的不是很详细,今天再次研究了下unicode,并给出详细的unicode取值范围。本次研究的unicode对象是unicode 5.2.0版本。现在最新的是6.0版对于这次研究的unicode把编码分为以下几个平面(英...
分类:
其他好文 时间:
2014-06-25 18:44:35
阅读次数:
601
软件简介BabelMap 是一个免费的字体映射表工具,可辅助使用《汉字速查》程序。该软件可使用系统上安装的所有字体浏览 Unicode 中的十万个字符,还带有拼音及部首检字法,适合文献工作者输入古、难、僻字,少数民族文字等各国语言文字。提供的注音信息可用于查找难字、僻字的读音。BabelMap 也是...
分类:
其他好文 时间:
2014-06-25 18:02:11
阅读次数:
226
1.iconv("gb2312","utf-8//IGNORE",$str),转码,这样转码后显示的汉字是uicode码,下面将unicode转为中文2.$array = array( 'test'=>urlencode("我是测试") ); $array =json_encode($array);...
分类:
Web程序 时间:
2014-06-25 17:41:09
阅读次数:
166
一、字符编码字符集1)字符集是字符的数字代码集。有ANSI/ASCII、MBCS(Multibytes)、Unicode等。比如“汉”字Unicode代码为0x6c49。编码方案2)编码方案是记录字符代码的方式。有UTF-8、UTF-16、GB2312等。编码方案分“变长编码”与“定长编码”两种。U...
本文最初发表于 http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=4143291&page=1#pid24220123
Hello
World!
In [3]: s.encode('string_escape')
Out[3]: 'Hello\\nWorld!'
In [4]: Out[3].decode(...
分类:
编程语言 时间:
2014-06-25 10:28:11
阅读次数:
967
正则表达式
正则表达式,Regular Expression,用于描述特定文法的字符串。许多编程语言和工具都支持正则表达式。
正则表达式-符号一览:
字符
作用
转义字符
^
区配字符串的开始位置
$
区配字符串的结束位置
*
重复n次,n>=0
+
重复...
分类:
其他好文 时间:
2014-06-25 08:13:06
阅读次数:
229
首先,要明白encode()和decode()的区别。
encode()的作用是将Unicode编码的字符串转换为其他编码格式。
例如:st1.encode("utf-8") 这句话的作用是将Unicode编码的st1编码为utf-8编码的字符串
decode()的作用是把其他编码格式的字符串转换成Unicode编码的字符串。
例如:st2.decode("utf-8") 这句话的作用是...
分类:
编程语言 时间:
2014-06-25 07:09:04
阅读次数:
283