原文地址:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同...
分类:
其他好文 时间:
2014-12-15 20:15:28
阅读次数:
360
今天个人coding的模块测试,所以闲暇之余继续研究solr,然后顺带写了一个实例,随便搞的,solr真心不熟,期待认识热爱搜索的朋友,共同进步.1.配置schema.xml文件[solr\collection1\conf\目录下]因为schema默认定义了一些Field,我们这里选取[id,tit...
分类:
其他好文 时间:
2014-12-15 13:38:02
阅读次数:
250
下午,计划2个小时搞定,个人官网第6次升级,就可以干点轻松的事了,结果,下午多搞了2个小时,晚上又搞了2个小时,才搞定。 最后一个世界难题是,URL传递中文参数。 问题大致是这么出现的:我为“博客雷观” 这个栏目,增加了“全文搜索”功能,用lucene实现的。因此,需要传递中文参数。搜索框表单提交,传递中文,很简单就搞定了。 搜索之后的分页url,需要带上当前的“搜索词” ,比如“...
一、介绍
Nexus是一个强大的Maven仓库管理器,它极大地简化了自己内部仓库的维护和外部仓库的访问。利用Nexus你可以只在一个地方就能够完全控制访问 和部署在你所维护仓库中的每个Artifact。Nexus是一套“开箱即用”的系统不需要数据库,它使用文件系统加Lucene来组织数据。Nexus 使用ExtJS来开发界面,利用Restlet来提供完整的REST APIs,通过m2eclips...
分类:
其他好文 时间:
2014-12-14 15:56:27
阅读次数:
193
solis search 是基于apache solr的一个umbraco搜索插件,只需要简单的配置就可以做全文检索,包括搜索上传的word文档,pdf文档等等。
分类:
其他好文 时间:
2014-12-14 13:14:31
阅读次数:
409
1界面1.1抓图:原则: 简化,直观,说明问题,有用 1.2说明:1 对指定文件夹创建索引2 输入关键词,显示查询结果2 实现2.1 创建button1_Click方法://对制定文件夹建立索引 private void button1_Click(object s...
分类:
其他好文 时间:
2014-12-14 13:10:48
阅读次数:
215
这样的需求其实挺特殊,每个“楼”都是一个独立的“树”,每个“楼”都“几乎”不用依赖其他的“楼”。 最简单、最高效的方式是用文件来存储每一个楼,每个新闻一个楼,使用xml、json等树形结构的文件格式来规范评论和新闻内容。这样每进一个楼只需要访问一个文件,发评论只是创建一个文件,把楼盖高,只是给增加新...
分类:
其他好文 时间:
2014-12-14 01:54:27
阅读次数:
317
本篇是大数据系列的开局篇,主要介绍了Hadoop家族,HDFS和MapReduce的概念;通过以“专利数据集”为测试对象,编写MapReduce Demo,了解Hadoop MapReduce的内部运行机制以及Map和Reduce的输入输出键值对如何生成与相互关联等。
分类:
其他好文 时间:
2014-12-13 17:43:37
阅读次数:
355
由于在商城模式下,不同频道很可能不断增加新筛选条件,导致筛选组合越来越复杂,最终可能要求我们从基于 NoSQL 的排序和筛选方案,尽快转变为基于搜索引擎的排序和筛选方案。
分类:
编程语言 时间:
2014-12-12 20:44:10
阅读次数:
703
2014-12-12 14:30
清华大学FIT楼二路多功能厅
整个讲座约一个小时,两点半左右开始,前半个小时左右Doug Cutting 总共大概7张PPT,后半个小时互动。
Doug Cutting总共讲了大概7张PPT,PPT里面没什么内容,每张PPT只有一个标题,正文是一张图片,内容主要讲的是自己的开源事业、lucene、hadoop等。
...
分类:
其他好文 时间:
2014-12-12 19:07:27
阅读次数:
262