在搜索过程中,如果我们每次请求中都传入很多固定的参数,会很繁琐,这里再solrconfig.xml中初始化定义一些不经常改动的搜索参数: explicit edismax text^0.5 features^1.0 na...
分类:
其他好文 时间:
2014-10-15 16:21:11
阅读次数:
213
Create EXTERNAL table obd_data_2( imei string, ts timestamp, fuel_instant float, gps_speed float, gps_status string, gps_longitude float, ...
分类:
其他好文 时间:
2014-10-15 12:25:10
阅读次数:
231
一、环境准备:
系统环境:CentOS 6.5
Tomcat 7.0.26
jdk-7u17-linux-x64.rpm
solr-4.10.1.tgz
首先将软件包上传到/tmp目录下
1、 jdk安装
]# rpm -ivh jdk-7u17-linux...
分类:
系统相关 时间:
2014-10-14 21:19:09
阅读次数:
380
废话不多说,我电脑配置 i7四核cpu 8G内存
插入数据文档中有5个字段,其中有两个分词,一个int,一个date
批量插入测试一次10万循环10次总共100万用时85秒
批量插入测试一次10万循环100次总共1000万用时865秒
插入性能还是不错的
查询测试
在12166454数据中(约等于一千两百万)总共占用硬盘2.8G
查询分词字段 title:中国用时0.031秒
...
分类:
其他好文 时间:
2014-10-14 17:15:08
阅读次数:
491
Solr的defType有dismax/edismax两种,这两种的区别,可参见:http://blog.csdn.net/duck_genuine/article/details/8060026下面示例用于演示如下场景:有一网站,在用户查询的结果中,需要按这样排序:VIP的付费信息需要排在免费信息...
分类:
编程语言 时间:
2014-10-14 14:46:28
阅读次数:
192
1.配置文件data-config.xml定义了数据库的基本配置,以及导出数据的映射规则,即导出数据库表中对应哪些字段的值,以及对特定字段的值做如何处理 '${dih.last_index_time}'" transformer="RegexT...
分类:
其他好文 时间:
2014-10-13 19:28:01
阅读次数:
442
win7 64位系统下安装tomcat8和solr 4.10.1
在去年的时候,就想把lucene,solr,nutch和hadoop这几个东东给详细的介绍下,但由于时间的关系,我还是只写了两篇文章,分别介绍了一下lucene和solr,后来就没有在写了,但我心里还是期待的,虽然到现在我没有真正搞过nutch和hadoop实战项目,但公司马上就要做hadoop大数据的监控了,我一直都说,要做一个有准备的人,因此我从去年到现在从未停止过对hadoop相关技术的学习、思考、实战。...
分类:
Web程序 时间:
2014-10-11 10:15:45
阅读次数:
240
#!/usr/bin/pythonimportjsonimportpycurlimportcStringIOdefwork_url(ip):buf=cStringIO.StringIO()c=pycurl.Curl()c.setopt(c.URL,"http://%s:8983/solr/collection1/admin/mbeans?stats=true&wt=json&_=1409194287592"%ip)c.setopt(c.WRITEFUNCTION,buf.write)c.per..
分类:
其他好文 时间:
2014-10-10 21:02:54
阅读次数:
183
参考文档:MoreLikeThisMoreLikeThisHandler在solr中有两种方式实现MoreLikeThis:第一种:SearchHandler中的MoreLikeThisComponent,MoreLikeThis以组件的身份出现,适于简单应用。第二种:MoreLikeThisHan...
分类:
其他好文 时间:
2014-10-10 17:13:14
阅读次数:
326