Python 获取Facebook特定用户的feed和link...
分类:
编程语言 时间:
2014-08-09 09:08:27
阅读次数:
848
京东评论情感分类器(基于bag-of-words模型)...
分类:
其他好文 时间:
2014-08-08 21:29:46
阅读次数:
572
Python 访问Facebook (http)...
分类:
编程语言 时间:
2014-08-07 07:15:59
阅读次数:
247
一、Mahout是什么?Mahout是Apache的一个开源项目(http://mahout.apache.org/),提供了机器学习领域的若干经典算法,以便开发人员快速构建机器学习和数据挖掘方面的应用。Mahout是基于Hadoop的。从名称上看也很有意思,Hadoop是一个大象的名字,而Maho...
分类:
其他好文 时间:
2014-08-07 03:04:39
阅读次数:
476
Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。将数据从ORACLE中抽取数据,经过hive进行分析转换,最后存放到ORACLE中去。本案例是纯demo级别,练手使用一、需求将emp和dept表的数据分析最后存放到result表。emp和de...
分类:
其他好文 时间:
2014-08-06 22:14:52
阅读次数:
371
聚类(Clustering)分析有一个通俗的解释和比喻,那就是“物以类聚,人以群分”。针对几个特定的业务指标,可以将观察对象的群体按照相似性和相异性进行不同群组的划分。经过划分后,每个群组内部个对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。 聚类技术一方面本身就是一种...
分类:
其他好文 时间:
2014-08-06 01:52:50
阅读次数:
203
一、关联规则中的频繁模式 关联规则(Association Rule)是在数据库和数据挖掘领域中被发明并被广泛研究的一种重要模型,关联规则数据挖掘的主要目的是找出:【频繁模式】:Frequent Pattern,即多次重复出现的模式和并发关系(Cooccurrence Relationships)....
分类:
其他好文 时间:
2014-08-06 01:34:20
阅读次数:
261
Python 分析Twitter用户喜爱的推文...
分类:
编程语言 时间:
2014-08-05 07:22:08
阅读次数:
329
回归(Regression)分析包括线性回归(Linear Regression),这里主要是指多元线性回归和逻辑斯蒂回归(Logistic Regression)。其中,在数据化运营中更多的使用逻辑斯蒂回归,它包括响应预测、分类划分等内容。 多元线性回归主要描述一个因变量如何随着一批自变量的变化....
分类:
其他好文 时间:
2014-08-04 23:58:10
阅读次数:
613
阿里云计算的ODPS从内部使用的工具变成了面向社会开放的大数据平台,开创了国内大数据公共服务的先河,降低了大数据在资金、人才和应用方面的门槛。小型企业只要花费几百元就能进行海量数据分析,这是真的吗?阿里云计算的大数据平台ODPS可以让你梦想成真。今年举行的阿里巴巴大..
分类:
其他好文 时间:
2014-08-04 18:11:18
阅读次数:
292