删除solr索引数据,使用XML有两种写法: 1) 2) 删除所有索引,这样写就可以了: 注意:这个<commit/>节点不能少,否则删除动作的事务不会提交。 删除索引管理界面运行: 也可以使用POST数据到这个URL方式运行: POST数据为: ...
                            
                            
                                分类:
其他好文   时间:
2018-05-17 18:51:18   
                                阅读次数:
154
                             
                         
                    
                        
                            
                            
                                    CommitTracker实现了runnable接口,根据solrconfig配置进行初始化 CommitTracker构造函数 可以看到软提交openSearcher=true,并表示此次为softcommit 而硬提交的openSearcher需要根据配置进行初始化 so,如果继续跟着流程发现D ...
                            
                            
                                分类:
其他好文   时间:
2018-05-17 00:54:57   
                                阅读次数:
172
                             
                         
                    
                        
                            
                            
                                    1、问题 在使用搜索引擎(Elasticsearch或Solr)作为应用的后台搜索平台的时候,会遇到停用词(stopwords)的问题。 在信息检索中,停用词是为节省存储空间和提高搜索效率,处理文本时自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。停用词大致分为两类。一类是语 ...
                            
                            
                                分类:
其他好文   时间:
2018-05-15 10:45:43   
                                阅读次数:
2834
                             
                         
                    
                        
                            
                            
                                增删节点 数据迁移 一、所有事情开始之前,先要备份好cloudera manager的数据库,以及hadoop集群中的一些组件带的数据库。这里保存了很多元数据,像hive这种丢了很麻烦的。 二、如果需要换nameNode的存储目录 1、备份nameNode原始数据 cp -r /ddhome/dfs ...
                            
                            
                                分类:
其他好文   时间:
2018-05-13 19:06:53   
                                阅读次数:
351
                             
                         
                    
                        
                            
                            
                                本次DTCC数据库技术大会是第9届了,这次大会虽然有不少公司的产品推介,总体来说还是有不少干货的。 专场较多,有选择地主要听了大数据实践跟流式计算这块。网易跟滴滴的分享比较不错。 了解到了现在大家是用spark streaming/ Flink来进行流式计算的比较多。 我们之前都是用kafka+st ...
                            
                            
                                分类:
数据库   时间:
2018-05-13 12:03:59   
                                阅读次数:
197
                             
                         
                    
                        
                            
                            
                                    一、简介 hue是一个开源的apache hadoop ui系统,由cloudear desktop演化而来,最后cloudera公司将其贡献给了apache基金会的hadoop社区,它基于python框架django实现的。 通过使用hue,我们可以使用可视化的界面在web浏览器上与hadoop集 ...
                            
                            
                                分类:
其他好文   时间:
2018-05-12 15:06:10   
                                阅读次数:
418
                             
                         
                    
                        
                            
                            
                                在nocdb转为pdb之后,发现有一个应用账号。从pdb使用expdp导出。导入其他nocdb。报错ORA-01917: user or role 'HUE' does not exist[oracle@lxtrac06 ~]$ more 1HUE.log ;;; Import: Release 1 ...
                            
                            
                                分类:
数据库   时间:
2018-05-10 11:27:06   
                                阅读次数:
230
                             
                         
                    
                        
                            
                            
                                    1. 起因 由于历史原因,公司的数据是持久化在HBase中,查询是通过Solr来实现,这这样的设计必然涉及到要把Hbase中的数据实时同步到Solr,但所有的服务都在一个同一个集群及每台机子都安装了很多不同的服务,导致数据经常丢失,Solr分片也经常在Recovering、Down 状态中游离,因此 ...
                            
                            
                                分类:
其他好文   时间:
2018-05-08 19:17:37   
                                阅读次数:
369
                             
                         
                    
                        
                            
                            
                                    有时间再进行整理package xxx.service.impl; import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; import org.apache.commons.beanutils.Bean... ...
                            
                            
                                分类:
其他好文   时间:
2018-05-08 16:37:25   
                                阅读次数:
151
                             
                         
                    
                        
                            
                            
                                    单机安装Solr服务: https://www.cnblogs.com/LUA123/p/7906774.html extend: install_solr_service.sh 参数说明: 安装脚本自身必须是root运行才行 -d solr数据数据目录,比如存放logs,pid文件,core目录等 ...
                            
                            
                                分类:
其他好文   时间:
2018-05-08 10:21:24   
                                阅读次数:
397