中文分词应用很广泛,网上也有很多开源项目。我在这里主要讲一下中文分词里面算法的简单实现,废话不多说了,现在先上代码
package com;
import java.util.ArrayList;
import java.util.List;
public class Segmentation1 {
private List dictionary = new ArrayList();
...
分类:
其他好文 时间:
2014-05-07 16:30:27
阅读次数:
317
树的实现
记住上一节树的定义,在定义的基础上,我们用以下的函数创建并操作二叉树:
BinaryTree() 创建一个二叉树实例 getLeftChild() 返回节点的左孩子 getRightChild() 返回节点的右孩子 setRootVal(val) 把val变量值赋给当前节点 getRootVal() 返回当前节点对象。 insertLeft(val) 创建一个新二叉树作为当前...
分类:
编程语言 时间:
2014-05-07 15:58:43
阅读次数:
504
本来是打算昨天晚上写的, 昨天网速渣的连CSDN都进不去,没办法 只能现在来写了
先写写对KM算法的理解,KM算法是对每个点设置一个顶标,只有当边长等于两边点的顶标之和的时候才进行增广,这样就能保证得到的一定是最大权匹配。
如果找不到匹配的时候就对交替路中X集合的顶标减少一个d Y集合的顶标增加一个d。
这样两个点都在交替路中的时候x[i]+y[i]的和不边
X在 Y不在的时候x[...
分类:
其他好文 时间:
2014-05-07 15:50:04
阅读次数:
348
上一篇文章中介绍了正向最大匹配,可以看到有时候效果不是很好,这里在介绍一种逆向最大匹配的算法。词典和匹配的字符串都和上一篇文章相同
只是本算法是从后到前搜索字符串,然后找到最长的匹配结果输出。上代码...
分类:
其他好文 时间:
2014-05-07 15:10:53
阅读次数:
238
有近两个月没有练习ACM了,终于在进入5月的时候,决定安排好各种事情,重新把练习算法和数据结构纳入每天必做的事情之中。鉴于上一阶段练习效果,总结出来凡事必“温故而知新,三思而后行”。之前对于ACM的各路招式(算法)抱有极大的好奇心,一口气做了不少的题,熟练度有提升,但思维能力未觉有所提高。究其原因....
分类:
其他好文 时间:
2014-05-07 14:45:25
阅读次数:
262
htmlSliding Menu
Effect据《华尔街日报》报道,彼得森国际经济研究所的两位经济学家利用新的数据分析方法得出结论,中国的货币没有被低估。Martin
Kessler和Arvind Subramanian使用新的PPP算法计算出,在2011年至2014年3月期间中国的人均GDP增速较...
分类:
其他好文 时间:
2014-05-07 14:43:16
阅读次数:
309
内存数据库,顾名思义就是将数据放在内存中直接操作的数据库。相对于磁盘,内存的数据读写速度要高出几个数量级,将数据保存在内存中相比从磁盘上访问能够极大地提高应用的性能。同时,内存数据库抛弃了磁盘数据管理的传统方式,基于全部数据都在内存中重新设计了体系结构,并且在数据缓存、快速算法、并行操作方面也进行了相应的改进,所以数据处理速度比传统数据库的数据处理速度要快很多,一般都在10倍以上。内存数据库的最大...
分类:
数据库 时间:
2014-05-07 12:30:30
阅读次数:
382
归并排序
归并排序 (merge sort) 是一类与插入排序、交换排序、选择排序不同的另一种排序方法。归并的含义是将两个或两个以上的有序表合并成一个新的有序表。归并排序有多路归并排序、两路归并排序 , 可用于内排序,也可以用于外排序。这里仅对内排序的两路归并方法进行讨论。
1.两路归并排序算法思路
①把 n 个记录看成 n 个长度为1的有序子表;
②进行两两归并使记录关键字有序,...
分类:
编程语言 时间:
2014-05-07 11:47:08
阅读次数:
347
变形了的最近点对,关键在于计算距离的时候,如果同类点的话,直接判定为无穷大即可。
其他闲话:
(1)因为一些原因,被迫暂时用回C++.
(2)好久没刷题,忘记了数组一开始要开最大,多次new和delete,导致超时。
(3) 感觉算法导论的最近点对没有考虑到有多个点都在一条vertical line上的情形。
#include
#include
#include
#include...
分类:
其他好文 时间:
2014-05-07 11:29:11
阅读次数:
334