-------------------中国所有省份和城市收录--------------------------
[ProvinceName]
name.1=北京(BeiJing)
name.2=上海(ShangHai)
name.3=天津(TianJin)
name.4=重庆(ChongQing)
name.5=香港(XiangGang)
name.6=澳门(Aomen)
nam...
分类:
其他好文 时间:
2014-06-15 17:08:25
阅读次数:
5784
汉字转拼音using System;using System.Data;using
System.Configuration;using System.Text;/// /// Summary description for
ConvertHzToPz_Gb2312/// namespace Com...
分类:
其他好文 时间:
2014-06-11 22:21:09
阅读次数:
1678
Ubuntu
12.04中文输入法的安装Ubuntu上的输入法主要有小小输入平台(支持拼音/二笔/五笔等),Fcitx,Ibus,Scim等。其中Scim和Ibus是输入法框架。在Ubuntu的中文系统中自带了中文输入法,通过Ctrl+Space可切换中英文输入法。这里我们主要说下Ubuntu英文系...
分类:
其他好文 时间:
2014-06-10 21:54:39
阅读次数:
301
拼音输入法输出的候选分成两个部分,系统词以及短句(智能组词),智能组词是通过model以及解码弄出来的,后续再说。
系统词就是那些常用的词(词组)收录到词典中,用户的输入和词典中的词match时,直接吐出来,而不需要解码获得。
系统词以及对应的rank(score)对输入法的体验很大,毕竟大多数用户还是继续短词输入。
系统词包含几个部分:
1.基础词
2.高频短串
3....
分类:
其他好文 时间:
2014-06-10 19:17:09
阅读次数:
231
输入法,尤其是拼音输入法,解决的就是一些序列标注的问题,针对给定的状态(拼音),获取其概率最高的隐状态(中文)。
这个是一个标准的HMM,针对HMM的解码过程,是一个很成熟也很完备的东西。
local的计算和存储能力都有限,我们选择一般是二阶马尔科夫,也就是所谓的bigram model。 高阶对质量会有帮助,但是涉及到存储和计算,工程上不可行。
同理,利用ME 以及CRFmodel...
分类:
其他好文 时间:
2014-06-10 18:18:23
阅读次数:
208
影响输入法体验的有两块,候选命中以及视觉交互,视觉交互就是看到的键盘以及用户的使用的方便程度,尤其是在手机输入法中,键盘布局以及一些默认设置等细节对体验影响很大。候选命中就是指用户输入拼音时,能否把用户的想要的东西放在第一位显示处理。
我们重点关注候选命中,UI是设计师的事情:)
影响候选命中因素很多,比如模型选择、剪枝策略等,其中决定候选命上限,也就是天花板的绝对是 训练预料,没有之...
分类:
其他好文 时间:
2014-06-10 14:22:06
阅读次数:
237
android文件众多,根据名称来辨别用途很重要,因此命名要规范这篇文章可参考:Android
命名规范
(提高代码可以读性)刚接触android的时候,命名都是按照拼音来,所以有的时候想看懂命名的那个控件什么是什么用的,就要读一遍甚至好几遍才知道,这样的话,在代码的审查和修改过程中就会浪费不少不必...
分类:
移动开发 时间:
2014-06-09 13:40:05
阅读次数:
345
电脑用的好好的,突然出现了关闭任意窗口都提示“已停止工作”,每次都是这样,想想也就是偶尔优化一下,最近也没有修改过什么系统设置呀,突然想到昨晚JLink_V8固件丢失,修复仿真器来着,但这也没什么影响啊,恩,后来因为嫌弃搜狗拼音输入法新版功能太多,我只是用来输入,根本不用其他的功能,就更换成了老版V4.3了,现在换回了最新V7版,故障解除。我猜可能是当时的搜狗版本还没有对windows8的很好支持...
在对银行账户等重要权限设置密码的时候,我们常常遇到这样的烦恼:如果为了好记用生日吧,容易被破解,不安全;如果设置不好记的密码,又担心自己也会忘记;如果写在纸上,担心纸张被别人发现或弄丢了...
这个程序的任务就是把一串拼音字母转换为6位数字(密码)。我们可以使用任何好记的拼音串(比如名字,王喜明,就写:wangximing)作为输入,程序输出6位数字。
变换的过...
分类:
其他好文 时间:
2014-06-05 04:38:24
阅读次数:
195
HMM 模型是语音和语言处理中最普遍使用的序列标注模型之一。HMM 模型的建模包
括三个问题:(1)估计观察序列的概率;(2)快速找到最优的状态序列;(3)自动进行 模型的参数估计。本文围绕这三个问题展开,并介绍了在中文分词、词性标注中、拼音
输入法中的使用;同时,对 HMM 模型的一些扩展模型也进...
分类:
其他好文 时间:
2014-05-30 05:24:57
阅读次数:
212