大数据概念
"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,...
分类:
其他好文 时间:
2014-11-22 09:22:45
阅读次数:
232
一、数据格式理解数据格式后,就可以完全控制数据预处理过程。1.1ARFF格式样例说明%整行注释@relationperson@attributenamestring%半行注释@attributeagenumeric@attributesex{male,female}@attributebirthdaydate"yyyy-MM-ddHH:mm:ss"@data"ZhangSan",85,male,‘2011-06-1000:0..
分类:
其他好文 时间:
2014-11-21 16:36:42
阅读次数:
222
作为数据挖掘常用的两个工具软件,R软件和weka软件各有千秋,本文对这两种数据挖掘软件进行了比较与分析。R软件介绍R是统计领域广泛使用的一款软件,是一个开放的统计分析和图形显示的程序设计环境,它与S编程语言相似。R可以看作是贝尔实验室(BellLaboratories)的RickBecker..
分类:
其他好文 时间:
2014-11-21 16:35:46
阅读次数:
457
世界互联网大会,这个行业最最牛的盛世,齐聚了全国最牛的互联网大牛。各个大佬都在喷移动,云,大数据挖掘;但是这些东西都是大家都在做的,也是都能说的,可是互联网的未来不在这,巨头们都知道,也都在布局,这个他们不能说,也不敢说。那么互联网的未来在哪里?
或许互联网的未来在没有互联网,或者叫颠覆自己。早上看了篇文章,叫《中国还在为淘宝买卖廉价次品沾沾自喜,欧美已开始4.0工业革命》中国的首富园...
分类:
其他好文 时间:
2014-11-21 10:48:29
阅读次数:
188
From:http://www.thebigdata.cn/JieJueFangAn/11932p2.htmlOnline-to-Offline( 简称 O2O)电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式。 O2O 商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚...
分类:
其他好文 时间:
2014-11-20 21:56:49
阅读次数:
305
From:http://www.cnblogs.com/tornadomeet/p/3395593.html 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话....
分类:
编程语言 时间:
2014-11-20 21:56:14
阅读次数:
343
数据挖掘中基本概念--数据类型的属性与度量 讨论一些与数据相关的问题,它们对于数据挖掘的成败至关重要。...
分类:
其他好文 时间:
2014-11-20 01:35:08
阅读次数:
292
我搞了个微信号(data_bird),关注大数据,数据挖掘,机器学习,深度学习。
与大家共同与时俱进!...
分类:
微信 时间:
2014-11-20 01:34:37
阅读次数:
309
大数据备份和恢复应用案例--通过分区表备份和恢复数据
海量数据备份和恢复方案
对于OLAP的数据库的业务特点,是将批量的数据加载入库,然后对这些数据进行分析处理,比如报表或者数据挖掘,最后给业务提供一种决策支持;另外,这类数据库的数据实时性非常高,一旦这些数据处理完毕后,就很少再次使用(有时,也需要对这类数据进行查询)。
对于OLAP数据库的备份和恢复可以考虑这样几种...
分类:
其他好文 时间:
2014-11-19 18:42:02
阅读次数:
309
大数据备份和恢复应用案例--通过分区表备份和恢复数据海量数据备份和恢复方案对于OLAP的数据库的业务特点,是将批量的数据加载入库,然后对这些数据进行分析处理,比如报表或者数据挖掘,最后给业务提供一种决策支持;另外,这类数据库的数据实时性非常高,一旦这些数据处理完..
分类:
其他好文 时间:
2014-11-19 16:27:11
阅读次数:
255