根据当初 hadoop 安装目录下 conf 目录的 core-site.xml
的设置,找到该目录:进入该目录在 data 和 name 文件夹下均有 current 文件夹 ,和 current 文件夹下有 VERSION
文件主要要做的是使这两个文件中的 namespaceID 相同接下来就是...
分类:
其他好文 时间:
2014-05-09 05:15:30
阅读次数:
305
Spark计算速度远胜于Hadoop的原因之一就在于中间结果是缓存在内存而不是直接写入到disk,本文尝试分析Spark中存储子系统的构成,并以数据写入和数据读取为例,讲述清楚存储子系统中各部件的交互关系。
分类:
其他好文 时间:
2014-05-09 05:14:32
阅读次数:
405
http://wiki.apache.org/hadoop/Hbase/ThriftApi首先根据Hbase.thrift文件生成Python接口代码,Hbase.thrift在Hbase的源码中有,路径src/main/resources/org/apache/hadoop/hbase/thrif...
分类:
编程语言 时间:
2014-05-09 02:51:31
阅读次数:
344
基于HBase实现的手机数据备份系统,实现了手机关键信息的备份,如短信、联系人等。
包括服务器端(Server)和客户端(Client)
Server运行环境:Hadoop+HBase+Tomcat
Client运行环境: Eclipse+Android2.3
-----------------------------------------------------
...
分类:
移动开发 时间:
2014-05-08 16:07:49
阅读次数:
390
SVD原理:
http://blog.csdn.net/wuyanyi/article/details/7964883
分类:
其他好文 时间:
2014-05-08 14:43:13
阅读次数:
317
以下内容主要基于《Latent Dirichlet
Allocation》,JMLR-2003一文,另加入了一些自己的理解,刚开始了解,有不对的还请各位指正。LDA-Latent Dirichlet
AllocationJMLR-2003摘要:本文讨论的LDA是对于离散数据集,如文本集,的一种生成式...
分类:
其他好文 时间:
2014-05-08 13:28:29
阅读次数:
909
1. What is the LDA?LDA(latent dilichlet allocation)
is a method to assign the topic (distribution) of a given document. However,
note that this model ...
分类:
其他好文 时间:
2014-05-08 13:16:49
阅读次数:
289
import java.io.IOException;import
org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import
org.apache.hadoop.io.Text;import org.ap...
分类:
其他好文 时间:
2014-05-08 11:27:24
阅读次数:
309
一、Combiner作用1、combiner最基本是实现本地key的聚合,对map输出的key排序,value进行迭代。如下所示:map: (K1, V1) →
list(K2, V2)combine: (K2, list(V2)) → list(K2, V2)reduce: (K2, list(V...
分类:
其他好文 时间:
2014-05-08 09:37:49
阅读次数:
472
默认情况下,hive的元数据信息存储在内置的Derby数据中。Facebook将hive元数据存储在关系数据库1、安装好mysql ,sudo apt-get
install mysql-server2、创建mysql用户hadoop $mysql-uroot-p 进入root用户 mysql>.....
分类:
数据库 时间:
2014-05-07 20:40:00
阅读次数:
554