关于nutch的基础知识能够參考lemo的专栏nutch支持二次开发,为了满足搜索的准确率的问题,考虑只将网页正文的内容提取出来作为索引的内容,相应的是parse_text的数据。我使用的事nutch1.4 版本号,在cygwin下运行crawl命令进行爬取。bin/nutch crawl urls...
分类:
其他好文 时间:
2014-12-31 18:00:36
阅读次数:
207
本文以提出spring中配置文件applicationContext.xml中所有bean的id为例,讲解如何使用vi的v和s命令两步提取出想要的内容。...
分类:
其他好文 时间:
2014-12-31 10:08:31
阅读次数:
160
模板方法模式定义一个操作中的算法的骨架,而将一些步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤。
何时应用:
1、需要一次性实现算法的不变部分,并将可变的行为留给子类实现
2、子类的共同行为应该被提取出来放到公共类中,避免代码重复
3、需要控制子类的扩展
典型应用:
1、C++ STL
2、系统底层框架:
2.1、Andro...
分类:
其他好文 时间:
2014-12-30 23:38:43
阅读次数:
220
k-近邻算法(kNN):测量不同特征值之间的距离方法进行分类。 kNN的工作原理:存在一个样本数据集合(训练样本集),并且样本集中每个数据都存在标签,输入没有标签的新数据后,将新数据的每个特征与样本集数据对应的特征进行比较,然后算法提取样本集中特征最相似数据的分类标签。一般来说,只选择样本数据...
分类:
其他好文 时间:
2014-12-30 16:48:27
阅读次数:
209
1.第一种方法
/*
不会说话的汤姆猫
1.图片名放在button的title中,提取出来用sender.currentTitle
2.每个文件夹中的图片个数存在button的tag值中,提取出来用sender.tag
*/
- (IBAction)clickBtn:(UIButton *)sender {...
分类:
其他好文 时间:
2014-12-30 15:25:28
阅读次数:
180
访问控制就是基于session来完成的,那么session又是什么呢?
session是JSP中的 一个内置对象,与浏览器一一对应,允许用户存储和提取会话状态的信息
session对象用来存储有关用户会话的所有信息
1.什么是会话呢?
(1)会话就是浏览器与服务器之间的一次通话,
它包含浏览器与服务器之间的多次请求、响应过程
(2)使用Web容器提供的会话跟踪机制,可以维持每...
分类:
Web程序 时间:
2014-12-30 15:21:59
阅读次数:
114
基于梯度金字塔(GradientPyramid,GP)分解的图像融合算法。GP也是一种基于高斯金字塔的多尺度分解算法。通过对高斯金字塔每层图像进行梯度算子运算,便可获得图像的GP表示。GP每层分解图像都包含水平、垂直和两个对角线四个方向的细节信息,能更好地提取出图像的边缘信息,提高了稳定性和抗噪.....
分类:
其他好文 时间:
2014-12-30 14:54:03
阅读次数:
248
基于小波的融合(wavelet) 小波变换的固有特性使其在图像处理中有如下优点:完善的重构能力,保证信号在分解过程中没有信息损失和冗余信息;把图像分解成平均图像和细节图像的组合,分别代表了图像的不同结构,因此容易提取原始图像的结构信息和细节信息;小波分析提供了与人类视觉系统方向相吻合的选择性图像。....
分类:
其他好文 时间:
2014-12-30 14:48:34
阅读次数:
282
继续昨晚没完成的主菜单模板: $menu): ?> -menus"> $submenu ): ?> ...
分类:
Web程序 时间:
2014-12-30 11:36:50
阅读次数:
218
使用struts框架的好处之一就是所有action类继承一个基类,将访问控制在基类中处理.2.所有的action类都继承自baseaction,一个资源对应一个action类.1.实现一个继承自struts的action的baseaction.从action类名提取资源名称,在mapping中的pa...
分类:
其他好文 时间:
2014-12-30 09:11:59
阅读次数:
225