Hadoop在百度的应用领域主要包括:大数据挖掘与分析,日志分析平台,数据仓库系统,用户行为分析系统,广告平台等存储与计算服务。
分类:
其他好文 时间:
2015-06-03 06:18:03
阅读次数:
128
Hadoop在百度的应用领域主要包括:大数据挖掘与分析,日志分析平台,数据仓库系统,用户行为分析系统,广告平台等存储与计算服务。目前百度的Hadoop集群规模已经超过数十个至多,单集群节点数目超过5000台,每天处理的数据量超过8000TB。同时百度在Hadoop的基础上还开发了自己..
分类:
其他好文 时间:
2015-06-03 06:16:38
阅读次数:
363
日志格式:
118.78.199.98–-[09/Jan/2010:00:59:59+0800]“GET/Public/Css/index.cssHTTP/1.1″304–
“http://www.a.cn/common/index.php”“Mozilla/4.0(compatible;MSIE6.0;WindowsNT5.1;SV1;GTB6.3)”
访问次数最多的10个IP:
awk‘{print$1}‘apache_log|sort|uniq-c|s..
分类:
Web程序 时间:
2015-05-29 18:29:00
阅读次数:
201
方案一:保存到日志文件中或者保存到document db(如mongodb)都是一个优秀的解决方案。保存到日志的话相对占用容量较少,不过需要自己写脚本分析日志。保存到document db的话相对占用容量较大,不过db自身提供多种查询解决方案可以很方便快速的查询自己想要的结果统计信息对于实效性要求都...
分类:
其他好文 时间:
2015-05-14 09:57:29
阅读次数:
123
日志记录了系统运行中的相关信息,分析日志对我们的系统排错、调优等至关重要,所以本文试浅析rsyslogserver和loganalyzer的图形化展示日志。rsyslog概述对Linux而言,应用程序和内核都有可能需要记录日志syslogd:为应用程序记录日志klogd:为内核记录日志上述两个守护进程由..
分类:
其他好文 时间:
2015-05-12 19:01:40
阅读次数:
124
服务器对时间要求非常严格,linux服务器文件的生成,日志,以及数据库的连接都是根据时间的逻辑进行任务处理,如果时间不同步,那么,处理的任务,以及出问题的分析日志,时间不对,很难分析直接更改linux服务器时间,影响特别大,大家都知道,服务器群启动是有规律的,如果随便更改linux服务器时间很有可能...
分类:
其他好文 时间:
2015-04-26 15:04:55
阅读次数:
164
JFS 文件系统概述及布局分析 日志文件系统如何缩短系统重启时间 如果发生系统崩溃,JFS 提供了快速文件系统重启。通过使用数据库日志技术,JFS 能在几秒或几分钟之内把文件系统恢复到一致状态,而非日志文件系统却要花上几小时甚至几天才能完成。本白皮书对 JFS 体系结构作了概述,并且描述了可在...
分类:
其他好文 时间:
2015-04-23 01:56:55
阅读次数:
223
转自:http://www.cnblogs.com/CraryPrimitiveMan/p/4437272.html一个PHP资源列表,内容包括:库、框架、模板、安全、代码分析、日志、第三方库、配置工具、Web 工具、书籍、电子书、经典博文等等。该内容也可以在github的相关项目上浏览。英文版:a...
分类:
Web程序 时间:
2015-04-20 11:05:25
阅读次数:
250
实验环境 win7 64 oracle PL/SQL Release 11.2.0.1.0 - Productionhttp://blog.csdn.net/tianlesoftware/article/details/5604497--这些操作需要在sysdba身份执行1.执行分析之前需要添加补充...
分类:
其他好文 时间:
2015-04-20 09:21:43
阅读次数:
226
http://www.cnblogs.com/CraryPrimitiveMan/p/4437272.html一个PHP资源列表,内容包括:库、框架、模板、安全、代码分析、日志、第三方库、配置工具、Web 工具、书籍、电子书、经典博文等等。该内容也可以在github的相关项目上浏览。英文版:awes...
分类:
Web程序 时间:
2015-04-20 09:19:54
阅读次数:
190