import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.Hanyu... ...
分类:
其他好文 时间:
2018-01-23 18:17:46
阅读次数:
201
strlen(str) 在strlen计算时,对待一个UTF8的中文字符是3个长度 PHP内置的字符串长度函数strlen无法正确处理中文字符串, 它得 到的只是字符串所占的字节数。 对于GB2312的中文编码,strlen得到的值是汉字个数的2倍, 而对于UTF 8编码的中文,就是3倍的差异了 ( ...
分类:
其他好文 时间:
2018-01-23 14:32:02
阅读次数:
188
一、日本汉字(KANJI)是两个字节表示的字符码,编码的方式是将其转换为13字节的二进制码制。 转换步骤为: 1、对于JIS值为8140(hex) 到9FFC(hex)之间字符: a)将待转换的JIS值减去8140(hex); b)将高位字节乘以C0(hex); c)将b)步骤生成的数据加上低位字节 ...
分类:
其他好文 时间:
2018-01-23 14:24:52
阅读次数:
87
维特比乍法是一个特殊但应用最广的动态规划算法,可以解决任何一个图中的最短路径问题。 这个算法是针对一个特殊的图——篱笆网络的有向图的最短路径提出的。 这个算法之所以重要,是因为凡是使用隐含马尔科夫模型描述的问题都可以用它来解码,包括今天 的数字通信,语音识别,拼音转汉字,分词等。 算法基础: 1、如 ...
分类:
编程语言 时间:
2018-01-22 11:10:18
阅读次数:
204
创建表: 修改表结构: 向数据表中添加数据: 修改表中数据: 特别注意一个问题,我在安装的时候设置的默认编码是utf8,但是windows默认的是gbk, 如果打开命令行会发现出现乱码问题,解决办法:在控制台中如果想显示正常的汉字,加入这一行: 查询表中的数据: 排序查询: 聚合函数: 分组查询: ...
分类:
数据库 时间:
2018-01-21 12:40:57
阅读次数:
266
匹配中文字符的正则表达式: [u4e00-u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注:可以用来删除空白 ...
分类:
Web程序 时间:
2018-01-20 15:14:14
阅读次数:
251
Pycharm Py开发工具 字符编码 ASCII码 由于ASCII码不包含汉字编码,国内研发了国标码 ,1981年发布了GB2312 ,收录汉字6763个,1995年发布GBK1.0,收录汉字21003个,2000年发布GB18030,收录汉字27484个,新版本兼容老版本,windows默认的中 ...
分类:
编程语言 时间:
2018-01-19 11:47:33
阅读次数:
294
因为看到百度里面这个人回答比较生动,印象比较深刻,所以转过来做个笔记 原文链接 https://zhidao.baidu.com/question/1047887004693001899.html 知乎也有更清晰解答 https://www.zhihu.com/question/23374078 1 ...
分类:
其他好文 时间:
2018-01-18 23:04:15
阅读次数:
136
一、论文的构成本科生毕业论文由封面、题目、摘要及关键词、目录、正文(绪论、主体、结论)、参考文献、附录、致谢等几部分构成。二、毕业论文各组成部分的内容要求(一)封面学校的名称位于封面上部顶端,其下为论文性质(即:本科生毕业论文),论文的题目位于封面中端,学号、姓名、学院、专业、指导教师、成绩、完成时 ...
分类:
其他好文 时间:
2018-01-18 17:24:56
阅读次数:
154