软件版本:Hadoop2.6,MyEclipse10.0 , Maven 3.3.2源码下载地址:https://github.com/fansy1990/knn 。1. KNN算法思路:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本...
分类:
编程语言 时间:
2015-07-28 13:07:39
阅读次数:
220
Hadoop windows编译:
参考building.txt以及http://wiki.apache.org/hadoop/Hadoop2OnWindows:
* Windows System - win8
* JDK 1.7+ - jdk1.8
* Maven 3.0 or later - maven 3.3
* Findbugs 1.3.9 (if running fin...
上一篇在win7虚拟机下搭建了hadoop2.6.0伪分布式环境。为了开发调试方便,本文介绍在eclipse下搭建开发环境,连接和提交任务到hadoop集群。1. 环境Eclipse版本Luna 4.4.1安装插件hadoop-eclipse-plugin-2.6.0.jar,下载后放到eclips...
分类:
系统相关 时间:
2015-07-27 22:31:11
阅读次数:
172
环境:hadoop2.2.0hive0.13.1Ubuntu 14.04 LTSjava version "1.7.0_60"Oracle10g***欢迎转载。请注明来源*** http://blog.csdn.net/u010967382/article/details/38709751到下面地址...
分类:
数据库 时间:
2015-07-27 09:22:46
阅读次数:
274
近几年大数据越来越火热。由于工作需要以及个人兴趣,最近开始学习大数据相关技术。学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘。第一篇,在win7虚拟机下搭建hadoop2.6.0伪分布式环境。1. 所需要的软件 使用Vmware 11.0搭建虚拟机,安装Ubuntu 1...
1.引入spark包:spark-assembly-1.4.0-hadoop2.6.0,在spark的lib目录下File-->project structure2.用IDEA建立一个scala项目,新建一个WordCount的object3.WordCount代码如下:import org.apa...
分类:
其他好文 时间:
2015-07-26 22:14:16
阅读次数:
175
一、Hadoop2.4.0环境下Eclipse平台的搭建
1.安装Eclipse
对于hadoop集群,我们将eclipse安装在master节点上,首先下载Eclipse安装包(如:eclipse-jee-luna-SR1-linux-gtk.tar.gz)然后用tar -zxvf 命令解压,并把解压后的目录移动到/usr/local路径下,然后启动eclipse:
下载网...
分类:
系统相关 时间:
2015-07-26 19:18:55
阅读次数:
254
编译部署Nutch2.3,Precondition:
hadoop 2.7.1
Nutch 2.3
hbase 1.0.1.1 / hbase 0.98.13
solr 4.8.1
Linux version 3.16.0-4-amd64
jdk1.8.0_45...
分类:
其他好文 时间:
2015-07-23 15:44:27
阅读次数:
272
翻译自Apache官方文档,Hadoop2.x版本的snapshot快照功能介绍。...
分类:
其他好文 时间:
2015-07-23 15:41:51
阅读次数:
113
Precondition:
hadoop 2.7.1
hbase 1.0.1.1 / hbase 0.98.13
192.168.1.106 ->master
192.168.1.105 ->slave / regionservers
hbase部署
直接下载hbase bin文件
hbase1.0.1.1 还有hbase 0.98.13 和hadoop2.7.1 /...
分类:
其他好文 时间:
2015-07-23 15:38:42
阅读次数:
135