印象笔记同步分享:Machine Learning—k-nearest
neighbor classification(k近邻分类)...
分类:
其他好文 时间:
2014-09-14 01:23:36
阅读次数:
168
An autoencoder neural network is an unsupervised learning algorithm that applies backpropagation, setting the target values to be equal to the inputs....
分类:
其他好文 时间:
2014-09-13 15:50:55
阅读次数:
313
前面介绍线性回归,但实际中,用线性回归去拟合整个数据集是不太现实的,现实中的数据往往不是全局线性的 当然前面也介绍了局部加权线性回归,这种方法有些局限 这里介绍另外一种思路,树回归 基本思路,用决策树将数据集划分成若干个子集,然后再子集上再用线性回归进行拟合 决策树是种贪心算法,最简单典型的决策树算...
分类:
其他好文 时间:
2014-09-12 18:41:13
阅读次数:
350
sparkSpark基于这样的理念,当数据庞大时,把计算过程传递给数据要比把数据传递给计算过程要更富效率。每个节点存储(或缓存)它的数据集,然后任务被提交给节点。所以这是把计算过程传递给数据。这和Hadoopmap/reduce非常相似,除了积极使用内存来避免I/O操作,以使得迭代算法(前一步计算输...
分类:
其他好文 时间:
2014-09-10 22:26:41
阅读次数:
191
首先整体认识:Hadoop是磁盘级计算,进行计算时,数据在磁盘上,需要读写磁盘;Storm是内存级计算,数据直接通过网络导入内存。读写内存比读写磁盘速度快n个数量级。根据Harvard CS61课件,磁盘访问延迟约为内存访...
分类:
其他好文 时间:
2014-09-10 17:58:21
阅读次数:
195
阅读前提: ????????1 : 您可能需要对 ?logback 日志系统有所了解 ???? ? ?2 :您可能需要对于?kafka 有初步的了解 ???? ? ?3:请代码查看之前,请您仔细参考系统的业务图解 ? ? ? ? ...
分类:
其他好文 时间:
2014-09-10 16:01:21
阅读次数:
258
一、环境3台虚拟机,系统为centos,zookeeper版本为3.4.3ip与hostname分别为192.168.41.100/master,192.168.41.101/slave1,192.168.41.102/slave2二、安装1、解压下载到的apache-storm-0.9.2-incubating.zip#tarzvxfapache-storm-0.9.2-incubating.tar.gz-C/home/hadoop/2、..
分类:
其他好文 时间:
2014-09-10 02:45:10
阅读次数:
266
我们想通过Storm提供的thrift接口来获取Toplogy的性能数据,比如emiited了多少,延迟是多少之类。但在使用Python开发过程中,发现getClusterInfo这个方法,会报错,thrift版本0.7,Storm版本为0.9.0.1,错误如下:Traceback (most re...
分类:
其他好文 时间:
2014-09-09 11:22:18
阅读次数:
167
在以前的版本使用default_scope:default_scope:order=>‘title‘现在使用rails4的时候报错,参考(hellolucky‘sblog)http://blog.hellolucky.info/articles/ruby-on-rails-rails4-learning-experience-finishing-rails-4-zombie-outlaws-1/现在是这么用的default_scope{ord..
分类:
其他好文 时间:
2014-09-08 10:58:47
阅读次数:
332
官方链接:http://storm.incubator.apache.org/documentation/Guaranteeing-message-processing.htmlWhat does it mean for a message to be “fully processed”?A tup...
分类:
其他好文 时间:
2014-09-08 00:59:26
阅读次数:
482