随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓娶管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的需求。目前对大数据的分析工具,首选的是Hadoop平台。Hadoop在可..
分类:
其他好文 时间:
2014-10-15 21:41:12
阅读次数:
350
前言本篇我们将总结的算法为Microsoft时序算法的结果预测值,是上一篇文章Microsoft时序算法的一个总结,上一篇我们已经基于微软案例数据库的销售历史信息表,利用Microsoft时序算法对其结果进行了预测,并且相应形成了折线预测图和模型依赖属性,有兴趣的同学可以点击查看,但是上篇文章的能给...
分类:
数据库 时间:
2014-10-15 21:27:01
阅读次数:
356
全世界每天都有几十亿人使用计算机、平板电脑、手机和其它数字设备产生海量数据。在这个各个行业和领域都已经被数据给渗透,数据已成为非常重要的生产因素的大数据时代,对于大数据处理和大数据挖掘将意味着新一波的生产率不断增长和消费者盈余浪潮的到来。 在大数据时代下,从头至尾我们都脱离不了数据挖掘。有人把...
分类:
其他好文 时间:
2014-10-15 11:32:10
阅读次数:
248
前言本篇文章同样是继续微软系列挖掘算法总结,前几篇主要是基于状态离散值或连续值进行推测和预测,所用的算法主要是三种:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,当然后续还补充了一篇结果预测篇,所涉及的应用场景在前几篇文章中也有介...
分类:
数据库 时间:
2014-10-14 18:59:49
阅读次数:
335
当今这个大数据时代,数据就等于金钱。随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。然而,百分之八十的数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理解、可用的结构化形式。在数据挖掘过程中,有大量的工具可供使用,比如采用人工智能、机器学习,以及其他技术等来.....
分类:
其他好文 时间:
2014-10-14 13:00:28
阅读次数:
205
kmeans是数据挖掘领域最为常用的聚类方法之一,最初起源于信号处理领域。它的目标是划分整个样本空间为若干个子空间,每个子空间中的样本点距离该空间中心点平均距离最小。因此,kmeans是划分聚类的一种。方法简单易懂,也很有说服力。但,不幸的是,这是一个NP-hard问题。首先来看一下NP问题。NP即...
分类:
其他好文 时间:
2014-10-13 23:20:57
阅读次数:
1672
SVM,支持向量机。数据挖掘中的一个经典算法,博主学了挺久,把学到的一些东西跟大家分享一下。
支持向量机(SVM,Support Vector Machine)是在高维特征空间使用线性函数假设空间的学习系统,它由一个来自最优化理论的学习算法训练,该算法实现了一个由统计学习理论到处的学习偏置.此学习策略由Vapnik和他的合作者提出,是一个准则性的
并且强有力的方法.在它提出来的若干年来,在范...
分类:
编程语言 时间:
2014-10-11 19:34:26
阅读次数:
352
校招部分岗位1:数据挖掘工程师(实习生),部门:阿里研究院-数据平台,人数:2人,工作地点:杭州能力要求:熟练运用sql就行。主要是做和政府,消费者,宏观经济等相关的数据挖掘和数据分析。要求:在校生即可(不限年级),至少每个星期可以来公司待3天的,全职更好。希望近期入职。团队介绍:我们致力于打造面向...
分类:
编程语言 时间:
2014-10-11 01:11:34
阅读次数:
246
Apriori算法和FPTree算法都是数据挖掘中的关联规则挖掘算法,处理的都是最简单的单层单维布尔关联规则。转自http://blog.csdn.net/sealyao/article/details/6460578Apriori算法Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法...
分类:
其他好文 时间:
2014-10-10 23:55:04
阅读次数:
1761