多维数据模型是为了满足用户从多角度多层次进行数据查询和分析的需要而建立起来的基于事实和维的数据库模型,其基本的应用是为了实现OLAP(Online Analytical Processing)。其中,每个维对应于模式中的一个或一组属性,而每个单元存放某种聚集度量值,如count或sum。数据立方体提...
分类:
其他好文 时间:
2014-09-17 21:47:22
阅读次数:
479
在数据挖掘过程中,高维数据是非常棘手的研究对象。特别是在文本挖掘、图像处理和基因数据分析中,维度过高使很多学习器无法工作或效率降低,所以降维也是数据预处理过程的一项必要任务。降维大致有两大类别,一类是从原始维度中提取新的维度,例如主成分分析或因子分析,再或者是奇异值分解或是多维标度分析。另一类是从原...
分类:
其他好文 时间:
2014-09-17 11:52:32
阅读次数:
928
一:Spark ? ? ?? Spark已正式申请加入Apache孵化器,从灵机一闪的实验室“电火花”成长为大数据技术平台中异军突起的新锐。本文主要讲述Spark的设计思想。Spark如其名,展现了大数据不常见的“电光石火”...
分类:
其他好文 时间:
2014-09-16 19:16:31
阅读次数:
210
excel2010提供了一些高级统计和分析引擎工具,缺省没有安装。如果你对excel的统计分析感兴趣,需要安装分析工具库。...
分类:
其他好文 时间:
2014-09-16 16:01:11
阅读次数:
322
《大数据日知录:架构与算法》前言
像移动互联网、O2O、可穿戴设备等概念一样,“大数据”从甫一提出到飓风般席卷并风靡全球,从最初的技术名词到形成渗透各行各业的社会现象,所耗时间仅几年而已,其兴也勃焉。
那么,大数据是否会像很多曾经火热现在已难觅踪迹的流行概念一样,将来某日,人们静心抬眼,发现风已去而水波不兴,徒留夕阳下波光粼粼的涟漪,让人不禁哀叹其亡也忽焉?
本书的背景
...
分类:
其他好文 时间:
2014-09-16 10:48:10
阅读次数:
284
常用的机器学习&数据挖掘知识(点)
声明:想做机器学习&数据挖掘的学弟学妹,可以看看,转载请说明出处...
常用的机器学习知识(点)
Basis(基础):
MSE(Mean Square Error 均方误差),LMS(LeastMean
Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihoo...
分类:
其他好文 时间:
2014-09-15 22:51:09
阅读次数:
340
IVS.3D.Fledermaus.Professional.v7.2.1.429 win32+win64 交互式三维数据可视化系统功能强大的交互式3维数据可视化系统。它可以帮助用户完成包括海洋(海岸、海底)资源调查与制图、环境影响评估、采矿、地质调查以及各种研究等等在内的工作。全新的数据挖掘技术包...
课程简介:
本讲通过回顾上一讲内容,引出了VC维的定义,它是由统计学习理论定义的有关函数集学习性能的一个重要指标。并通过例子证明函数集的VC维就是它能打散的最大样本数目。课程最后介绍VC维的应用,指出它反映了函数集的学习能力,VC维越大则学习机器越复杂...
分类:
其他好文 时间:
2014-09-11 23:57:02
阅读次数:
573
对于许多人来说数据库的概念可谓耳熟能详,但当涉及到数据仓库的时候大多数人可能就不是那么熟悉了。在本节中主要从数据仓库的概念(什么是数据仓库)、数据仓库如何构建、数据仓库提出的意义(数据仓库在实际中的应用)三个方面展开。1.何为数据仓库(Data Warehouse) William H. I...
分类:
其他好文 时间:
2014-09-10 19:10:10
阅读次数:
349