“大数据”已成为近三年来使用频率最高的技术热词,越来越多的企业开始拥抱大数据技术,并将大数据应用引入到日常生产经营环境中。相应的市场也在 这一年中出现了迅速增长,和大数据相关的Hadoop及其生态系统技术变成了数据科学家们的常用工具。市场研究机构IDC预测:至2016 年,Hadoop将实现8.12...
分类:
其他好文 时间:
2014-08-13 18:10:16
阅读次数:
219
上周末,帮朋友处理了一个关于大数据的查询与导出问题,整理一下,在此记录一下用以备忘,同时也为有类似需要的朋友提供一个参考. 背景: 数据库服务使用: SqlServer2008 ; 查询的流水表总数据量约在 800W 条左右 ; 需要展示的字段需要从流水表+基础资料表中 导出需要 加载指定模板 ; ...
分类:
其他好文 时间:
2014-08-13 18:01:47
阅读次数:
294
随着大数据在各个领域的深入应用,大数据本身存在的价值也正在凸显, 研究人员与商业用户等分析大数据,是为了洞察客户的真正需求。 数据有价值,公司离不开数据,但是数据究竟有多值钱呢?分析大数据并从中获取价值的成本到底有需要多少呢? 在过去,技术专家向高级管理层提供的是历史数据,以便他们能够确定市...
分类:
其他好文 时间:
2014-08-13 18:00:46
阅读次数:
291
http://www.csdn.net/article/2012-12-20/2813054-Databasehttp://blog.csdn.net/qjfpjie/article/details/8439119
分类:
其他好文 时间:
2014-08-13 17:32:26
阅读次数:
141
1.一般用C语言节约空间,要用C++库函数或STL时才用C++;cout、cin和printf、scanf最好不要混用。大数据输入输出时最好不要用cin、cout,防止超时。2.有时候int型不够用,可以用long long或__int64型(两个下划线__)。值类型表示值介于 -2^63 ( -9...
分类:
其他好文 时间:
2014-08-13 12:54:16
阅读次数:
186
最近,有幸和国内不同行业的CIO(医疗、教育、互联网、金融等)交流了大数据的看法,听了听他们一线用户对于大数据的理解,总体来看他们对于大数据本身充满了积极的热情,并且对于大数据有着深刻的认知包括对于大数据技术、产品以及“瓶颈”,虽然现阶段这些行业企业开展大数据仍然存在一定的阻力,但这些行业CIO.....
分类:
其他好文 时间:
2014-08-13 12:52:56
阅读次数:
172
大数据和以往的信息产出方式相比具有三个明显的特征—数据量大、非结构性和实时性,它创造了一个无限可能的世界。企业正在以史无前例的方式建立和应用大数据解决方案,这些方案不仅能够帮助他们实现收益的最大化,更重要的是他们重新定义了与客户的关系。
企业为何变得如此痴迷?大数据真的和以前大范围数据处理有着如此大的差别么?
? 抽样数据分析VS全数据分析
直到...
分类:
其他好文 时间:
2014-08-13 10:32:25
阅读次数:
2210
大数据下的游戏营销模式革新邓大付博士腾讯专家工程师Bio:毕业于华中科技大学,现任腾讯IEG运营部数据中心技术副总监,负责腾讯游戏的数据挖掘相关工作,包括有用户画像,推荐系统,基础算法研究等。主要感兴趣的领域包括有分布式计算平台系统架构,机器学习算法等。=======================...
分类:
其他好文 时间:
2014-08-13 00:42:25
阅读次数:
453
在面对大数据量的排序时(100W以上量级数据),通常用以下三种的排序方法:快速排序、归并排序,堆排序。在这个量级上,其他冒泡,选择,插入排序等已经根本没法看了,效率极低,跟前面三种排序差了千百倍,因此不作比较。这三种排序的平均时间复杂度均为O(nlogn),快速排序,归并排序在面对基本有序序列排序时...
分类:
编程语言 时间:
2014-08-12 21:36:44
阅读次数:
286
第一印象:主办方尽心尽力,两天的展会安排得合理而紧凑。通常两天的展会,第一天热闹,第二天清淡,到了第二天下午就纷纷撤展了。但是本次TechCrunch在第二天晚上还安排了一个party。嘉宾互动穿插了全过程。第二印象,参展单位集中在“大数据/云/移动/互联网应用/健康”领域。..
分类:
其他好文 时间:
2014-08-12 17:38:34
阅读次数:
219