主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, ...
分类:
其他好文 时间:
2016-07-30 19:53:50
阅读次数:
303
错误:ERROR: Could not find mahout-examples-*.job in /home/grid/mahout-distribution-0.8 or /home/grid/mahout-distribution-0.8/examples/target, please run ...
分类:
其他好文 时间:
2016-07-25 16:06:54
阅读次数:
207
HDFS:分布式文件系统 MapReduce:分布式计算框架 Sqoop:数据库ETL工具 Flume:日志收集工具 Mahout:数据挖掘库 Hive:数据仓库 Pig:数据流处理 HBase:实时分布式数据库 Zookeeper:分布式协作服务 ...
分类:
其他好文 时间:
2016-07-01 20:14:23
阅读次数:
166
一、Mahout简介 查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个Mahout) 步入正文啦: Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集 ...
分类:
其他好文 时间:
2016-06-21 10:43:25
阅读次数:
127
做了个APP,名字很土,叫《学啥》。用今日头条的方法推荐公开课。服务端是阿里云CentOS7+Play!+Scala+Docker+Appache Mahout, 爬虫是Scrapy,做了安卓客户端和简易的iOS客户端。代码开源在:https://github.com/foamliu/hackath ...
分类:
其他好文 时间:
2016-06-04 00:21:44
阅读次数:
538
首先我们先了解一下Hadoop的起源。然后介绍一些关于Hadoop生态系统中的具体工具的使用方法。如:HDFS、MapReduce、Yarn、Zookeeper、Hive、HBase、Oozie、Mahout、Pig、Flume、Sqoop。...
分类:
其他好文 时间:
2016-05-27 12:20:23
阅读次数:
157
实验简介 本次课程学习了Mahout 的 Bayes 分类算法。 一、实验环境说明 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到桌面上的程序: XfceTerminal: Linux 命令行终端,打 ...
分类:
编程语言 时间:
2016-05-23 16:52:11
阅读次数:
206
文字总结自《Mahout in Action》中文版第六章的内容1.1 数据集介绍Wikipedia数据集:一篇文章到另外一篇文章的链接。
可以将文章看作是用户,将该文章指向的文章视为该源文章所喜欢的物品。
类型:单向布尔型偏好。
相似性评估算法:LogLikelihoodSimilarity
关于LogLikelihoodSimilarity具体算法思想见:
对数似然比相似度 - xid...
分类:
编程语言 时间:
2016-05-12 14:14:34
阅读次数:
316
推荐引擎简介
推荐引擎利用特殊的信息过滤(IF,Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的,或是基于用户所在的社会或社团环境。
根据如何抽取参考特征...
分类:
Web程序 时间:
2016-05-04 12:02:42
阅读次数:
356
项目:1:基于Hadoop的手机日志查询分析 已完结2:基于Mahout的线下推荐系统设计与实现 已完结3:基于MATLAB的神经网络原型设计与实现 进行中4:基于神经网络的人脸识别检测与分析 进行中 5:基于Spark的splib平台大数据整合分析与实现 进行中6:基于SILT的NoSql键值对存 ...
分类:
其他好文 时间:
2016-04-28 01:44:36
阅读次数:
158