Magnolia简介:Magnolia CMS是一家瑞士公司自2003年起发布的一个基于Java的开源内容管理系统。它适合且已被使用在以下领域:电子商务(例如:COOP、Migros、Rossmann)、银行(例如:巴克莱银行、苏格兰银行、ING、American Express)、媒体娱乐(例如:...
分类:
Web程序 时间:
2014-10-04 02:46:35
阅读次数:
428
注明:本文是由本人在开发有关基于lucene资源检索系统时的一点总结,当中一部分是自己依据开发过程自己总结的,也有部分是摘自网络,因无法获取当时摘文的地址,所以在此没有写源地址。转载请声明出处Lucene-3.0.0配置一、Lucene开发环境配置step1.Lucene开发包下载step2.Jav...
分类:
其他好文 时间:
2014-10-03 15:32:14
阅读次数:
361
人物介绍姓名:DougCutting个人名望:开发出开源全文检索引擎工具包Lucene。个人简介/主要荣誉:除了 Lucene,还开发了著名的网络爬虫工具 Nutch,分布式系统基础架构Hadoop,这些大师级作品都是开源的。目前任职 Apache 软件基金会主席。网络上对 Doug Cutting...
分类:
其他好文 时间:
2014-10-03 13:28:14
阅读次数:
368
Nutch1.2的安装与使用1、nutch1.2下载 下载地址 http://archive.apache.org/dist/nutch/2、nutch1.2目录bin:用于命令行运行的文件;conf:Nutch的配置文件;lib:一些运行所需要的jar文件;plugins:存放相应的插件;src:...
分类:
其他好文 时间:
2014-10-03 12:18:04
阅读次数:
215
注意,IK Analyzer需要使用其下载列表中的 IK Analyzer 2012FF_hf1.zip,否则在和Lucene 4.10配合使用时会报错。 我使用 intellij IDEA 12进行的测试。 建立java项目 建立项目HelloLucene,导入Lucene的几个库。“...
分类:
其他好文 时间:
2014-10-02 22:50:53
阅读次数:
182
酒店评论情感分析系统(二)——Nutch安装一、需求部分Nutch是Java开发的所以需要下载JavaJDK。 下载地址http://java.sun.com/javase/downloads/index.jsp 2. Nutch的演示搜索页面是Jsp的,需要Tomcat做服务器。 下载地...
怎样处理海量数据在实际的工作环境下,很多人会遇到海量数据这个复杂而艰巨的问题,它的主要难点有下面几个方面:一、数据量过大,数据中什么情况都可能存在。假设说有10条数据,那么大不了每条去逐一检查,人为处理,假设有上百条数据,也能够考虑,假设数据上到千万级别,甚至过亿,那不是手工能解决的了,必须通过工具...
分类:
其他好文 时间:
2014-09-30 20:59:40
阅读次数:
310
大型网站系统架构演化之路分享到:更多72014-09-26 分类:云计算/大数据、编程开发暂无人评论前言一个成熟的大型网站(如淘宝、京东等)的系统架构并不是开始设计就具备完整的高性能、高可用、安全等特性,它总是随着用户量的增加,业务功能的扩展逐渐演变完善的,在这个过程中,开发模式、技术架构、设计思....
分类:
Web程序 时间:
2014-09-30 17:00:59
阅读次数:
249
前言 一个成熟的大型网站(如淘宝、天猫、腾讯等)的系统架构并不是一开始设计时就具备完整的高性能、高可用、高伸缩等特性的,它是随着用户量的增 加,业务功能的扩展逐渐演变完善的,在这个过程中,开发模式、技术架构、设计思想也发生了很大的变化,就连技术人员也从几个人发展到一个部门甚至一条产品 线。所以成熟....
分类:
Web程序 时间:
2014-09-29 11:33:47
阅读次数:
231
为解决全站搜索问题。对开源搜索引擎的一个比较。在我的项目中,是ssh+jsp结构。选择solr是最佳的。1. Lucene及其变种LunceneLucene的开发语言是Java,也是Java家族中最为出名的一个开源搜索引擎,在Java世界中已经是标准的全文检索程序,它提供了完整的查询引擎和索引引擎,...
分类:
其他好文 时间:
2014-09-29 00:42:46
阅读次数:
288