public static string getFirstCode(string myChar) { byte[] arrCN = System.Text.Encoding.Default.GetBytes(myChar); if (arr...
分类:
其他好文 时间:
2015-01-10 13:53:18
阅读次数:
140
中文分词技术
http://blog.csdn.net/u012637501
一、中文分词技术
1.中文分词:上一篇博文我们谈到利用统计语言模型进行自然语言处理,而这些语言模型主要是建立在词的基础上的,因为词是表达语义的最小单位。对于西方拼音来讲,词之间有明确的分界符,统计和使用语言模型非常直接,如I
love China very much.但是对于中文来说,由于词之间没有明确的分...
分类:
其他好文 时间:
2015-01-10 11:20:46
阅读次数:
1190
常用汉语声母韵母及汉语拼音表声母23个:b,p,m,f,d,t,n,l,g,k,h,j,q,x,zh,ch,sh,r,z,c,s,y,w韵母24个:由于汉语拼音与英语不同,在实际编制程序时需去掉相同的字母,此处为避免产生歧义所以保留了a,o,e i,u,ǔ,ai,ei,ui,ao,ou,iu,ie,...
分类:
其他好文 时间:
2015-01-09 23:37:40
阅读次数:
307
图片 Code Text This Text, Text, and Text! Live Write里,有的时候 Google 拼音会失效
分类:
其他好文 时间:
2015-01-09 10:44:21
阅读次数:
105
应用场景:将数据表TB_USER中字段NNDP的内容中为[sannanyinv]转换为[3男1女]主要脚本:一个游标脚本+分割字符串函数+拼音转数字脚本操作步骤如下:1、创建类型 create or replace type splitTable is table of varchar2(100);2、创建函数fn_splitString(功能是将字符串分割成多条记录)--测试语句select *...
分类:
数据库 时间:
2015-01-08 18:12:06
阅读次数:
237
点击查看效果1、页面结构: 城市拼音: 拼音支持首字母输入 A-E F...
分类:
其他好文 时间:
2015-01-08 17:33:51
阅读次数:
198
下面介绍一下我的这个demo。流程简述:我在raw文件夹下面放了名称为city的数据库,里面包含全国2330个城市,以及所属省,拼音简写等信息。首先 在进入MainActivity的时候,创建数据库并读入sd卡文件中data/data/databases/city。 然后 我再开启子线程去读取前50...
分类:
数据库 时间:
2015-01-08 16:56:44
阅读次数:
343
/********************************************************作者:版本:1.0创建时间:修改时间:功能:自动生成 检索码(拼音码)参数:汉字拼音输出:拼音检索汉字******************************************...
分类:
其他好文 时间:
2015-01-07 20:34:18
阅读次数:
207
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Text.RegularExpressions;public class PinYin{ //定义拼音区...
分类:
其他好文 时间:
2015-01-06 15:06:17
阅读次数:
194
对于一些标准字体,HALCON给我们提供了一些标准库调用,但是在字符分割上会因为字符成像的问题分割效果不是很好导致一些误识别。我整理了一些经常性误识别的字符分成三组;第一组 1、i、l 第二组a、0、o、D第三组Z、2这三组先声明下 a 误判的是中文形式的拼音a,这个字母我不知道该用什么识别,在我碰...
分类:
其他好文 时间:
2015-01-06 13:34:27
阅读次数:
114