继上次匆匆搭建起结合solr和nutch的所谓站内搜索引擎之后,虽当时心中兴奋不已,可是看了看百度,再只能看看我的控制台的打印出每个索引项的几行文字,哦,好像差距还是有点大…… 简陋的信息显示环境最起码给了我一个信号,这条路没有走错,好吧,让我们来继续探索搜索引擎的奥秘吧。 上期回顾:上次主要是介绍 ...
分类:
其他好文 时间:
2017-09-03 00:31:10
阅读次数:
274
最近看完nutch后总感觉像好好捯饬下solr,上次看到老大给我展现了下站内搜索我便久久不能忘怀。总觉着之前搭建的nutch配上solr还是有点呆板,在nutch爬取的时候就建立索引到solr服务下,然后在solr的管理界面中选择query,比如在q选项框中将“*:*”改写为“title:安徽”,则 ...
分类:
其他好文 时间:
2017-09-03 00:21:11
阅读次数:
157
原文地址:https://mp.weixin.qq.com/s?srcid=0831kfMZgtx1sQbzulgeIETs&scene=23&mid=2663994161&sn=cee222a8534cbc6e28c401706e979dc0&idx=1&__biz=MzA3ODUxMzQxMA% ...
分类:
其他好文 时间:
2017-08-31 14:37:40
阅读次数:
156
CDH5.7卸载1.记录用户数据目录2.关闭所有服务2.1在CM中,选择某个集群,然后停止集群。2.2逐个关闭CDH中的服务3.删除parcels4.删除集群5.卸载Cloudera manager server5.1 如果是用Cloudera-manager-installer.bin 文件安装5... ...
分类:
其他好文 时间:
2017-08-30 22:28:28
阅读次数:
342
1. 知识点HSLA颜色:HSLA(H,S,L,A),取值:H:Hue(色调)。0(或360)表示红色,120表示绿色,240表示蓝色,也可取其他数值来指定颜色。取值为:0 – 360;S:Saturation(饱和度)。取值为:0.0% - 100.0%;L:Lightness(亮度)。取值为:0 ...
分类:
Web程序 时间:
2017-08-30 15:38:27
阅读次数:
143
原文地址:http://www.cnblogs.com/chowmin/articles/4629220.html 搜索引擎选型调研文档 Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,... ...
分类:
其他好文 时间:
2017-08-30 11:09:33
阅读次数:
159
自定义fieldType时,通常还会用到filter。filter必须跟在tokenizer或其它filter之后。如: Solr 提供了很多的filter,具体如下: 1. ASCII Folding Filter 2. Beider-Morse Filter 3. Classic Filter ...
分类:
其他好文 时间:
2017-08-29 16:26:12
阅读次数:
163
这里可以看到,solr的版本,lucene的版本,jvm的版本,CPU核数,jvm启动参数,还有物理内存占用,交换空间占用,jvm内存占用。 这里可以看到每个core的情况。 这里可以看到java的所有properties。 这里可以看到当前选中的core的信息。文档数,最大文档数,片段数,删除文档... ...
分类:
其他好文 时间:
2017-08-29 14:21:57
阅读次数:
158
(1)TOP 显示当前进程状态,结合 ps -aux 可以看是哪一个服务。 (2)TOP -H -u 用户名 显示该用户下 所有的线程。 还有pstree (3)jstat -gc pid 1000 100 查看当前程序的GC问题 (4)jstack pid 看 有哪些进程是 RUNNING WAI ...
分类:
其他好文 时间:
2017-08-29 13:00:16
阅读次数:
172