IK Analyzer 3.0特性采用了特有的"正向迭代最细粒度切分算法",具有80万字/秒的高速处理能力采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。优化的词典存储,更小的内存占用...
分类:
其他好文 时间:
2014-07-16 00:54:37
阅读次数:
800
横滚角(Roll) bank、roll 绕y轴z轴正向为起点逆时针方向:往左为正,往右为负,水平时为0;有效范围:-180度~180度注:下图是从飞机的尾部-->头部方向观察所得俯仰角(El)pitch、elevation 绕x轴z轴负向为起点顺时针方向:竖直向下时为0度,水平时为90度,竖直向上时...
分类:
其他好文 时间:
2014-07-14 14:49:53
阅读次数:
194
本文采用正向工程1.搭建工程工程名称:mvcsh2.添加支持的jar包1).spring-3.2.0.jar注:struts相关的jar不需要\libs\*.jarcom.springsource.org.aopalliance-1.0.0.jarcom.springsource.org.aspectj.weaver-1.6.8.RELEASE.jarcommons-logging.jar2).hibernate-distribution-3.6...
分类:
编程语言 时间:
2014-07-13 15:08:22
阅读次数:
259
在采用FMM (正向最大匹配) 进行中文分词的时候, 可能会存在比较多的交集歧义, 这个时候为了解决交集歧义的问题, 可以采用 FM (Forwar Matching, 正向匹配) 进行中文分词, 正向匹配会在最大匹配的路径上查找所有可能成词的term(这里所有可能成词的term的意思是在构建索引的时候所有切分出来的词, 因为不是路径上的所有节点都会是切分成的词)。
http://blo...
分类:
其他好文 时间:
2014-07-12 22:23:26
阅读次数:
383
最近接触NLP中文分词, 在lunr.js的基础上, 实现了中文的最大正向匹配分词。
某些情况下, 我们在服务器端进行中文文本分词可以使用完整的基于mmseg算法的分词模块, 例如nodejieba, node-segment, 盘古分词等等, 但是在客户端环境下, 我们不能使用这些复杂的分词算法进行分词, 这个时候可以根据已经生成的索引进行简单的客户端分词, 就是所说的FMM (Forwar...
分类:
其他好文 时间:
2014-07-12 22:18:57
阅读次数:
301
中文分词中存在交集歧义检测问题, 例如“互联网金宝” 可以切分为“互联网” 和“金宝”, 也可以切分为“互联”和“网金宝”, 如何在切分过程中检测是否有交集歧义发生, 以及如果存在交集歧义的话怎么处理切分问题, 是非常重要的话题。
这里, 可以采用FMM算法进行切分, 首先切分出最大的正向匹配, 然后进行交集歧义检测, 如果检测到存在交集歧义, 那么对可能存在歧义的一段文字进行FM切分, 获取所有的可能切分结果; 然后对剩下的query子句重复进行FMM切分, 直到query == null...
分类:
其他好文 时间:
2014-07-12 18:26:14
阅读次数:
264
文件查看主要有以下命令cat、more、less、head、tailcat命令:是一个文本文件查看和连接工具。从第一个字节开始正向查看文件的内容,适用于小文件以第一行开始,显示没有停顿,文件较长的话,只能看到最后一页内容在屏幕上当文件内容过多时,就带来一个问题,因为文本在屏幕上迅速地闪过,用户来不及...
分类:
系统相关 时间:
2014-07-07 20:30:16
阅读次数:
354
转:http://blog.csdn.net/shixing_11/article/details/7106241一直对反射代理的反向不知道如何理解,经过百度知道,再结合下面这幅图,总算弄清楚一点了。简单的说从一个局域网出来到服务端为正向,从客户端要进入一个局域网为反向概念: 反向代理(Reve.....
分类:
其他好文 时间:
2014-07-07 19:19:47
阅读次数:
184
纯中文和中英文混杂的唯一区别是,分词的时候你如何辨别一个字符是英文字符还是孩子字符,人眼很容易区分,但是对于计算机来说就没那么容易了,只要能辨别出中文字符和英文的字符,分词本身就不是一个难题1:文本的编码问题: utf8:windows下,以utf8格式保存的文本是一个3个字节(以16进制)的BO....
分类:
其他好文 时间:
2014-07-03 23:26:07
阅读次数:
299
英语渣就是这点不好。。。
巨恶心这种描述多的题。。
大意就是求 从一个点出发,到某些点,然后又从那些点返回的距离之和的 最小值。
Dijkstra+邻接矩阵。 正向建图,求出出发距离,然后swap边,求出 返回距离。
注意的是 车可能有重复的。某个点有多少车就需要乘以车的数量。
#include
#include
#include
#include
#in...
分类:
其他好文 时间:
2014-07-02 07:16:49
阅读次数:
253