elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是mmseg的,下面分别介绍ik的用法, 当我们创建一个index(库db_news)时,easticsearch默认提供的分
简单的日志分析排除命令,不过建议使用goacess日志分析视图化观察比较好,面对一些爬虫攻击,可以在nginx.conf配置文件里调用limitrequst模块来限制连接数,如限制每秒钟的请求数:rate=10r/s,这是要依据业务情况来设置的。1分析日志封IPcd/nginx/logs[root@web100logs]#awk‘{..
分类:
其他好文 时间:
2016-03-08 13:39:37
阅读次数:
146
技术准备 宿主于Ubuntu14.04.2平台下,基于MYSQL5.5.46版本。 日志文件记录了MySQL数据库的各种类型的活动,作为日常定位问题的最常用的一种分析手段,Mysql数据库中常用的日志文件分为以下几类:错误日志、二进制日志、慢查询日志,查询日志。 一、错误日志 该日志记录了MySQL
分类:
数据库 时间:
2016-03-08 00:07:34
阅读次数:
282
ElasticSearch之下(图解搜索的故事) 在ElasticSearch之下(图解搜索的故事) 摘要 先自上而下,后自底向上的介绍ElasticSearch的底层工作原理,试图回答以下问题: 为什么我的搜索 *foo-bar* 无法匹配 foo-bar ? 为什么增加更多的文件会压缩索引(In
分类:
其他好文 时间:
2016-03-06 23:37:31
阅读次数:
262
作为一个入门级的菜鸟来说,学会使用git管理自己的代码是进阶必不可少的一步。很早就注册了github账号,但是一直什么也没写,实习的部门架构师开始规范大家编写程序的规范,要求必须有相关文档,而且代码版本控制工具也打算从SVN换成git。我还想参与Elasticsearch官方文档的翻译,学习git迫
分类:
其他好文 时间:
2016-03-05 17:35:00
阅读次数:
267
前提:处理大数据日志收集分析,随着搜索集群的快速膨胀,大量日志处理及情况反馈滞后带来一系列问题,亟需一个工具能快速分析定位集群中那种日志或那个机器出现了异常。运维的日志分析系统定制化较重,分析不够实时。故找一个RTF工具可以直接即上手。1、简介:logstash日志收..
分类:
其他好文 时间:
2016-03-04 16:35:09
阅读次数:
436
公司成立快三年了,中间一直在思考公司的生存,目标和方向,很多时候感叹草民创业是多么的困难,每每看到某某顶着BAT光环的创业者拿到了多少多少的投资,心里很是羡慕。但是经过2015年的资本疯狂后,资本寒冬慢慢的到来,这时才发现有很多人都在裸泳,海潮一退出现了大量的死亡..
分类:
其他好文 时间:
2016-03-04 14:38:45
阅读次数:
216
序 在学习使用python处理日志开始阶段,对我阻力最大的莫过于对linux的不熟悉了,有种寸步难行的感觉。 在之后乱学一通之后,发现有点对我颇有益处: 学《鸟哥linux私房菜基础学习篇》,内容不多,但是对linux文件系统和基本组成有个基本的认识很有必要; 熟悉使用vim。开始的时候每次都下载到
分类:
系统相关 时间:
2016-03-02 14:54:37
阅读次数:
347
需要编辑的文件是config/elasticsearch.yml文件 需要配置的项目有: # Use a descriptive name for your cluster: # cluster.name: Hadoop # # -----------------------------------...
分类:
其他好文 时间:
2016-03-01 00:45:08
阅读次数:
240
转自raywenderlich 作为一名应用开发者,你是否有过如下经历? 为确保你的应用正确无误,在将其提交到应用商店之前,你必定进行了大量的测试工作。它在你的设备上也运行得很好,但是,上了应用商店后,还是有用户抱怨会闪退 ! 如果你跟我一样是个完美主义者,你肯定想将应用做到尽善尽美。于是你打开代码
分类:
移动开发 时间:
2016-02-29 23:14:26
阅读次数:
391