Kafka 由LinkedIn于2010年12月(https://thenewstack.io/streaming-data-at-linkedin-apache-kafka-reaches-1-1-trillion-messages-per-day/)开源出来一个消息的发布/订阅系统,用scala ...
分类:
Web程序 时间:
2017-02-25 19:56:27
阅读次数:
479
0、引言 Kafka是LinkedIn开源出来的一款消息服务器,用Scala语言实现;这货的性能是百万级的QPS(估计是挂载了多块磁盘),我随便写个测试程序就是十万级。 1、Kafka基本概念 在Kafka中消息是按照Topic进行分类的;每条发布到Kafka集群的消息都有一个类别,这个类别被称为T ...
分类:
其他好文 时间:
2017-02-17 14:54:08
阅读次数:
251
文档位置: /Users/baidu/Documents/Data/Interview/机器学习-数据挖掘/Kafka 据说是目前见到的最好的 Kafka 中文文章 。 Kafka 是一个消息系统,原本开发自 LinkedIn,用作 LinkedIn 的活劢流(activity stream) 和运 ...
分类:
其他好文 时间:
2017-01-22 18:17:24
阅读次数:
174
新智元推荐 来源:LinkedIn 作者:Abhishek Thakur 译者:弗格森 【新智元导读】本文是数据科学家Abhishek Thakur发表的Kaggle热门文章。作者总结了自己参加100多场机器学习竞赛的经验,主要从模型框架方面阐述了机器学习过程中可能会遇到的难题,并给出了自己的解决方 ...
分类:
其他好文 时间:
2017-01-17 23:12:30
阅读次数:
1019
kafka是linkedin用于日志处理的分布式消息队列, 同时支持离线和在线日志处理。 kafka对消息保存时根据Topic进行归类, 发送消息者成为 Producer,消息接受者成为 Consumer,此外 kafka 集群有多个kafka实例组成, 每个实例(server)称为broker。 ...
分类:
其他好文 时间:
2017-01-14 21:01:10
阅读次数:
237
使用堆外内存减少Full GC - JVM
大部分主流互联网企业线上Server JVM选用了CMS收集器(如Taobao、LinkedIn、Vdian), 虽然CMS可与用户线程并发GC以降低ST...
分类:
其他好文 时间:
2017-01-13 12:02:54
阅读次数:
429
先说下hadoop 内置工作流的不足 (1)支持job单一 (2)硬编码 (3)无可视化 (4)无调度机制 (5)无容错机制 在这种情况下Azkaban就出现了 1)Azkaban是什么 Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作 ...
分类:
其他好文 时间:
2016-12-30 19:32:37
阅读次数:
1793
Kafka——性能逆天的存在
(by 刘延允,2016-12-17)
0、引言
Kafka是LinkedIn开源出来的一款消息服务器,用scala语言实现;这货的性能是百万级的QPS(估计是挂载...
分类:
其他好文 时间:
2016-12-22 00:35:23
阅读次数:
293
Kafka是分布式发布-订阅消息系统 https://www.biaodianfu.com/kafka.html Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一个分布式的,可划分的,冗余备份的持久性的日志服务。它主要用于处理活 ...
分类:
其他好文 时间:
2016-12-21 21:12:49
阅读次数:
201