原文链接:http://blog.csdn.net/hguisu/article/details/8454368简单和明了,Storm让大数据分析变得轻松加愉快。当今世界,公司的日常运营经常会生成TB级别的数据。数据来源囊括了互联网装置可以捕获的任何类型数据,网站、社交媒体、交易型商业数据以及其它商...
分类:
其他好文 时间:
2014-11-19 20:28:26
阅读次数:
425
这篇博客对应的是Andrew.Ng的那篇文章:An Analysis o f Single-Layer Networks in Unsupervised Feature Learning,文章的主要目的是讨论receptive field size,number of hidden nodes, s...
分类:
其他好文 时间:
2014-11-19 20:03:54
阅读次数:
255
Andrew Ng的UFLDL最近更新了,具体更新时间为9月di...
分类:
其他好文 时间:
2014-11-19 18:50:00
阅读次数:
218
http://blog.csdn.net/weijonathan/article/details/18301321一直以来都想接触Storm实时计算这块的东西,最近在群里看到上海一哥们罗宝写的Flume+Kafka+Storm的实时日志流系统的搭建文档,自己也跟着整了一遍,之前罗宝的文章中有一些要注...
分类:
Web程序 时间:
2014-11-19 10:32:28
阅读次数:
345
1、准备工作2、一个Storm集群的基本组件3、Topologies4、Stream5、数据模型(Data Model)6、一个简单的Topology7、流分组策略(Stream grouping)8、使用别的语言来定义Bolt9、可靠的消息处理10、单机版安装指南本文翻译自:https://git...
分类:
其他好文 时间:
2014-11-18 13:09:04
阅读次数:
216
美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流。美团的日志收集系统基于Flume设计和搭建而成。《基于Flume的美团日志收集系统》将分两部分给读者呈现美团日志收集系统的架构设计和实战经验。第一部分架构和设计,将主要着眼于日志收集系...
分类:
Web程序 时间:
2014-11-18 11:44:44
阅读次数:
312
Machine Learning:Neural Network---Representation
Non-Linear Classification
如果还采取简单的线性分类手段,那么会面临着过拟合以及效率低下的问题(如图所示),然而neural network则可以很好的解决非线性分类问题。
Model representation
第一层称为input la...
分类:
Web程序 时间:
2014-11-18 00:30:10
阅读次数:
290
请通过以下方式下载本系列文章的Github示例代码:
git clone https://github.com/davenkin/gradle-learning.git
Gradle最常用的Plugin便是java Plugin了。和其他Plugin一样,java Plugin并没有什么特别的地方,只是向Project中引入了多个Task和Property。当然,java P...
分类:
编程语言 时间:
2014-11-17 17:55:21
阅读次数:
158
http://blog.pluskid.org/?p=17
k-means
好久没有写 blog 了,一来是 blog 下线一段时间,而租 DreamHost 的事情又一直没弄好;二来是没有太多时间,天天都跑去实验室。现在主要折腾 Machine Learning 相关的东西,因为很多东西都不懂,所...
分类:
其他好文 时间:
2014-11-17 15:32:27
阅读次数:
515
事先配置2台服务器配置好zookeeper,在配置文件中用zookeeper管理集群,配置文件如下配置文件/conf/storm.yamlsupervisor.slots.ports: 对于每个Supervisor工作节点,需要配置该工作节点可以运行的worker数量。每个worker占用一个单独的...
分类:
其他好文 时间:
2014-11-16 21:28:57
阅读次数:
273