Description 字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后所形成的字符序列。令给定的字符序列X=“x0,x1,…,xm-1”,序列Y=“y0,y1,…,yk-1”是X的子序列,存在X的一个严格递增下标序列<i0,i1,…,ik-1>,使得对所 ...
分类:
其他好文 时间:
2017-05-13 11:21:41
阅读次数:
243
参考:http://www.mamicode.com/info-detail-1705113.html 先声明,热更新词库,需要用到,web项目和Tomcat。不会的,请移步 Eclipse下Maven新建项目、自动打依赖jar包(包含普通项目和Web项目) Tomcat *的安装和运行(绿色版和安 ...
分类:
其他好文 时间:
2017-05-11 12:50:47
阅读次数:
279
比如有两条记录Document0: id:1 pk content :hello Document1: id :1 pk content :hello world建立索引用ik分词,建立索引 搜索content 会出现两条记录解决:使用 QueryFilter进行搜索过滤 Query query = ...
分类:
Web程序 时间:
2017-05-10 00:13:53
阅读次数:
191
相对于英文检索,中文检索有两个特别要考虑的问题:编码问题和中文分词问题。 一、编码问题 1. 为了解决中文编码问题,我们在网页结构化信息预处理的时候统一采用utf-8编码; 2. 在Lucene创建索引的时候,构造一个BufferedReader对象以utf-8编码读取文件,使用如下语句: Buff ...
分类:
其他好文 时间:
2017-05-07 10:19:34
阅读次数:
184
package lld; import org.apache.poi.hssf.usermodel.HSSFCell; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFShe ...
分类:
其他好文 时间:
2017-05-05 00:57:26
阅读次数:
243
性能测试(测试指标监控策略汇总) 性能测试(测试指标监控策略汇总) 监控类别 监控指标 监控工具或命令 APP前端 响应时间、吞吐量、TPS、点击率、超时概率、错误概率、页面性能 工具:ddms25、页面工具:YSlow3.1、ChromDevTools(基于Chrome57)综合工具:GT、Emm ...
分类:
其他好文 时间:
2017-05-04 14:37:31
阅读次数:
175
分词器的核心类: Analyzer:分词器 TokenStream: 分词器做优点理之后得到的一个流。这个流中存储了分词的各种信息,能够通过TokenStream有效的获取到分词单元。 下面是把文件流转换成分词流(TokenStream)的过程 首先,通过Tokenizer来进行分词,不同分词器有着 ...
分类:
Web程序 时间:
2017-04-30 17:17:16
阅读次数:
190
AMD CodeXL 2011年发布的AMD CodeAnalyst Performance Analyzer 现在已经被AMD CodeXL所替代。AMD CodeXL的主要目的是帮助开发者更好利用CPU, GPU和APU的计算性能,具有强大的GPU调试、CPU和GPU代码分析、及静态的OpenC ...
分类:
其他好文 时间:
2017-04-29 10:51:36
阅读次数:
201
Pcap-Analyzer简单离线数据包分析器主要功能:1.展示数据包基本信息2.分析数据包协议3.分析数据包流量4.绘制出访问IP经纬度地图5.提取数据包中特定协议的会话连接(WEB,FTP,Telnet)6.提取会话中的敏感数据(密码)7.简单的分析数据包中的安全风险(WEB攻击,暴力破解)8.提..
分类:
其他好文 时间:
2017-04-26 19:29:23
阅读次数:
232