apache 下 使用 利用svn的 post-commit 功能自动同步代码...
分类:
其他好文 时间:
2014-06-07 01:15:19
阅读次数:
223
apache kafka监控系列-KafkaOffsetMonitor
如何给kafka做监控...
分类:
其他好文 时间:
2014-06-05 05:20:36
阅读次数:
264
最近学习了解了一下OSGI技术,感觉OSGI虽然有一定的学习难度,但是最终掌握和推广之后将是一项对系统开发比较有用的技术。在此和大家分享一下自己的感悟。
1、什么是OSGI
OSGI直译为“开放服务网关”,是一个由OSGI联盟发起的以Java为技术平台的动态模块化规范。目前主要的实现有:apache的Felix、Eclipse的Equinox等
2、使用OSGI的好处
...
分类:
其他好文 时间:
2014-06-05 00:56:31
阅读次数:
290
在Eclipse中,配置log4j.xml出现“http //jakarta.apache.org/log4j/ uri is not registered”的错误信息。
原始的log4j.xml配置文件:
解决方法,具体修改如下所示。...
分类:
其他好文 时间:
2014-06-04 23:29:47
阅读次数:
277
最近开始使用MapReduce,发现网上大部分例子都是对文本数据进行处理的,也就是说在读取输入数据时直接使用默认的TextInputFormat进行处理即可。对于文本数据处理,这个类还是能满足一部分应用场景。但是如果要处理以二进制形式结构化记录存储的文件时,这些类就不再适合了。
本文以一个简单的应用场景为例:对按照二进制格式存储的整数做频数统计。以此来说明如何重写FileInputFormat来实现对非文本数据的处理。...
分类:
其他好文 时间:
2014-06-04 21:53:46
阅读次数:
341
在使用Bulkload向HBase导入数据中, 自己编写Map与使用KeyValueSortReducer生成HFile时, 出现了下面的异常:
java.io.IOException: Non-increasing Bloom keys: 201301025200000000000003520000000000000500 after 20131119510000000000000001...
分类:
编程语言 时间:
2014-06-03 05:55:44
阅读次数:
359
DistributedCache 是一个提供给Map/Reduce框架的工具,用来缓存文件(text, archives, jars and so on)...
分类:
其他好文 时间:
2014-06-03 02:18:37
阅读次数:
332
1. 数据统计的需求
互联网上对于数据的统计,一个重要的应用就是对网站站点数据的统计,例如CNZZ站长统计、百度统计、Google Analytics、量子恒道统计等等。
网站站点统计工具无外乎有以下一些功能:
1)网站流量统计:包括PV、UV、IP等指标,这些统计指标可以以趋势图的形式展示出来,如最近一周、最近一个月等。
2)IP来源信息统计:记录各个来源IP下的访问PV...
分类:
其他好文 时间:
2014-06-03 01:33:36
阅读次数:
226
YARN对内存资源和CPU资源采用了不同的资源隔离方案。对于内存资源,它是一种限制性资源,它的量的大小直接决定应用程序的死活,因为应用程序到达内存限制,会发生OOM,就会被杀死。CPU资源一般用Cgroups进行资源控制,Cgroups控制资源测试可以参见这篇博文Cgroups控制cpu,内存,io...
分类:
其他好文 时间:
2014-05-31 18:47:58
阅读次数:
264