Mahout小案例学习,实现k-means算法。环境:OS:Centos 6.5 x64 &
Soft:Hadoop 1.2.1 & Mahout 0.91、下载测试数据[huser@master hadoop]$ wget
http://archive.ics.uci.edu/ml/databas...
分类:
其他好文 时间:
2014-05-04 12:34:58
阅读次数:
340
使用hbase的目的是为了海量数据的随机读写,但是在实际使用中却发现针对随机读的优化和gc是一个很大的问题,而且hbase的数据是存储在Hdfs,而Hdfs是面向流失数据访问进行设计的,就难免带来效率的下降。下面介绍一下Facebook
Message系统在HBase online storage场...
分类:
其他好文 时间:
2014-05-04 11:08:29
阅读次数:
337
之前在写MR
job的时候,由于要在云梯,或者一淘的开发集群上运行;所以处理方法是,在本地打成jar包,然后scp到客户端网关机上,然后在提交job运行。这样的问题时,有时候如果遇到一些逻辑上的问题,job跑挂了。必须在本地修改程序,然后重新打包,scp,再运行,这样比较麻烦;询问了一圈,觉得采用M...
分类:
其他好文 时间:
2014-05-04 10:54:29
阅读次数:
427
软件环境: 虚拟机:VMware Workstation 10
操作系统:ubuntu-12.04-desktop-amd64 JAVA版本:jdk-7u55-linux-x64 Hadoop版本:hadoop-1.2.1
Hadoop下载地址:http://mirrors.cnnic.cn/apa...
分类:
其他好文 时间:
2014-05-04 10:43:51
阅读次数:
370
MapReduce
job中,可以使用FileInputFormat和FileOutputFormat来对输入路径和输出路径来进行设置。在输出目录中,框架自己会自动对输出文件进行命名和组织,如:part-(m|r)-00000之类。但有时为了后续流程的方便,我们常需要对输出结果进行一定的分类和组织。...
分类:
其他好文 时间:
2014-05-04 10:22:15
阅读次数:
341
异常(Exception)是程序在执行过程中所产生的问题。导致异常的原因有很多,例如:用户输入无效的数据、找不到一个需要打开的文件、在通讯过程中网络中断、JVM内部内存溢出等等。
有些异常是由用户操作所导致的、有些是程序员的错误导致的,有些则是硬件的故障导致的。所以异常分为错误(error)、...
分类:
编程语言 时间:
2014-05-04 10:17:24
阅读次数:
312
前段时间有一个业务需求,要在外网商品(TOPB2C)信息中加入联营自营识别的字段。但存在的一个问题是,商品信息和自营联营标示数据是两份数据;商品信息较大,是存放在hbase中。他们之前唯一的关联是url。所以考虑用url做key将两者做join,将联营自营标识信息加入的商品信息中,最终生成我需要的数...
分类:
其他好文 时间:
2014-05-04 10:02:22
阅读次数:
565
dataNode 无法启动是配置过程中最常见的问题,主要原因是多次format namenode 造成namenode 和datanode的clusterID不一致。建议查看datanode上面的log信息。解决办法:修改每一个datanode上面的CID(位于dfs/data/current/VERSION文件夹中)使两者一致。...
分类:
其他好文 时间:
2014-05-03 21:37:44
阅读次数:
308
大纲:一、什么是Keepalived?二、VRRP协议简介.三、Keepalived原理.四、Keepalived配置文件详解.五、Keepalived配置示例.一、什么是Keepalived?什么是Keepalived呢,keepalived观其名可知,保持存活,在网络里面就是保持在线了,也就是所谓的高可用或热备,用来防止单点故障(..
分类:
其他好文 时间:
2014-05-03 20:48:19
阅读次数:
528
一、忘记root密码进入单用户模式清除root密码,重新设置密码二、MBR错误先制造错误输入ddif=/dev/zeroof=/fev/sdads=446count=1清除MBR,输入init6重启这时你会发现已经进不去系统了进入救援模式(必须拥有系统光盘)或者进入boot输入linuxrescue进入救援模式三、stage2失效插..
分类:
其他好文 时间:
2014-05-03 20:46:53
阅读次数:
305