基础知识点:Squid:Squid cache(简称为Squid)是一个流行的自由软件,它符合GNU通用公共许可证。Squid作为网页服务器的前置cache服务器,可以代理用户向web服务器请求数据并进行缓存,也可以用在局域网中,使局域网用户通过代理上网。Squid主要设计用于在Linux一类系统运...
分类:
其他好文 时间:
2014-09-21 10:16:40
阅读次数:
497
Solr4.8.0源码分析(10)之Lucene的索引文件(3)1. .si文件 .si文件存储了段的元数据,主要涉及SegmentInfoFormat.java和Segmentinfo.java这两个文件。由于本文介绍的Solr4.8.0,所以对应的是SegmentInfoFormat的子类Lu....
分类:
其他好文 时间:
2014-09-21 00:34:29
阅读次数:
507
在最近的一个项目需要实现在单表中对多字段进行多个关键字的模糊查询,但这数个关键字并不一定都存在于某个字段 例如现有table表,其中有title,tag,description三个字段,分别记录一条资料的标题,标签和介绍。...
分类:
数据库 时间:
2014-09-20 19:22:29
阅读次数:
311
最起码要掌握以下东西才能使高手~~慢慢学吧~~学无止境~~宏观上:1.技术广度方面至少要精通多门开源技术吧,研究过struts\spring等的源码。2.项目经验方面从头到尾跟过几个大项目,头是指需求阶段,包括需求调研。尾是指上线交付之后,包括维护阶段。3.架构经验方面有过分布式系统的架构和开发经验...
分类:
编程语言 时间:
2014-09-19 23:44:26
阅读次数:
1844
Jspxcms-5.1.0-release今天正式发布。这次发布重点提高了系统的稳定性和可维护性、修复了BUG。
分类:
编程语言 时间:
2014-09-19 17:22:35
阅读次数:
293
大型分布式网站架构设计与实践(一线工作经验总结,囊括大型分布式网站所需技术的全貌、架构设计的核心原理与典型案例、常见问题及解决方案,有细节、接地气/京东:大型分布式网站所需技术的全貌、架构设计的核心原理与典型案例、常见问题及解决方案)陈康贤 著 ISBN 978-7-121-23885-72014年...
分类:
Web程序 时间:
2014-09-19 11:48:15
阅读次数:
450
源代码下载:NaviveBayesClassify.rarPreface文本的分类和聚类是一个比较有意思的话题,我以前也写过一篇blog《基于K-Means的文本聚类算法》,加上最近读了几本数据挖掘和机器学习的书籍,因此很想写点东西来记录下学习的所得。在本文的上半部分《基于朴素贝叶斯分类器的文本分类...
分类:
其他好文 时间:
2014-09-18 22:02:34
阅读次数:
325
近期用Lucene做了个比较简单的站内检索,在这里和大家做个交流。全文检索的实现,从检索的数据源来分有两种:一种是数据库,另一种是已生成的文件(doc,html,txt......)。无论哪一种方式,实现原理都是一样的。主要分为两大步:一、将数据源转换为Lucene文件,保存到设定目录下privat...
分类:
其他好文 时间:
2014-09-18 20:34:04
阅读次数:
202
看一个简单的例子:mport java.io.IOException;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.index.I...
分类:
其他好文 时间:
2014-09-18 16:25:04
阅读次数:
135
1.北京圣思Java培训教学视频(资源共享网)2.Lucene/WebService/SVN/Ant/SpringMVC视频(学习资料库网)3.JUnit和Ant视频教程(VeryCD社区)4.《张孝祥JAVA视频教程》完整版[RMVB](东西网)5.历经5年锤炼(史上最适合初学者入门的Java基础...
分类:
其他好文 时间:
2014-09-18 16:18:34
阅读次数:
440