我们在hdfs的/data/join创建两个文件:
上传第一个文件名称为1.txt
内容第一列是日期,第二列uid(普通用户id)
上传第二个文件名称为2.txt
内容第一列是日期,第二列uid(普通用户id)
执行上传到hdfs:
hdfs命令行查询:
web控制台管理查询:
首先在命令行中设置日期格式:
然后声明...
1.创建表注意问题指定字符间隔2.装载数据分两种,从本地文件系统装载和从HDFS中装载,本地装载HDFS装载:几个简单的HDFS命令:创建目录:查看目录:hive: use databasename;show tables;show database;
分类:
其他好文 时间:
2015-01-13 19:26:33
阅读次数:
119
阅读导读:
1.简述用Mahout实现协同过滤ItemCF的步骤?
2.如何用API实现Hadoop的各种HDFS命令?
3.Kmeans.java类报错,暂时可以怎么处理?
1.
Mahout开发环境介绍
在用Maven构建Mahout项目文章中,我们已经配置好了基于Maven的Mahout的开发环境,我们将继续完成Mahout的分步式的程序开发。
本文的...
分类:
其他好文 时间:
2014-10-26 14:23:16
阅读次数:
297
有多种接口可以访问HDFS,其中命令行接口是最简单,也是程序员最熟悉的方式。
在本例中,将采用pseusodistributed mode的HDFS,用一台机器来模拟分布式的文件系统。pseudodistributed mode的配置参见:http://blog.csdn.net/norriszhang/article/details/38659321
这里再重新说一下两处配置的含义:...
分类:
其他好文 时间:
2014-09-11 19:29:02
阅读次数:
190