码迷,mamicode.com
首页 >  
搜索关键字:beam 大数据    ( 12980个结果
你是大数据电影中的主角吗?
主角:英雄        你就是这部电影的主角。你正以超乎想象的方式挑战着技术领域。现在我们用的手机已经远比《星际迷航》中的先进,也许在未来的某一天拥有“进取号”也并不是遥不可及的事。这归功于我们现在高速的系统处理速度,今天的大数据云系统将以更深远、更迅猛的方式,帮助你超越自己。        所以,谢谢大数据在我们身边,一直保持着真我本色。不断挑战我们,质询我们,激励我们去超越自己。是的...
分类:其他好文   时间:2014-09-12 15:10:53    阅读次数:219
40集hadoop教程,免费下载分享
一个分布式系统基础架构,由Apache基金会所开发。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 [1] Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量(high throughput)来访问应用程...
分类:其他好文   时间:2014-09-12 13:33:03    阅读次数:284
【互动问答分享】第11期决胜云计算大数据时代Spark亚太研究院公益大讲堂
Q1:docker成熟度如何? ???????? Docker是2013年和2014年最火爆的云计算开源项目; ???????? Baidu公司是中国使用Docker最为深入和最大规模的公司,线上稳定运行数十万个Docker容器,目前已经使...
分类:其他好文   时间:2014-09-12 12:08:03    阅读次数:392
【互动问答分享】第11期决胜云计算大数据时代Spark亚太研究院公益大讲堂
Q1:docker成熟度如何? Docker是2013年和2014年最火爆的云计算开源项目; Baidu公司是中国使用Docker最为深入和最大规模的公司,线上稳定运行数十万个Docker容器,目前已经使用Docker全面全面升级了自己的BAE,升级后的BAE无论是性能还是业务表现均超出预期;Q2:...
分类:其他好文   时间:2014-09-12 11:32:53    阅读次数:294
原理系列:Spark1.x 生态圈一览
Spark生态圈,也就是BDAS(伯克利数据分析栈),是伯克利APMLab实验室精心打造的,力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成,来展现大数据应用的一个平台,其核心引擎就是Spark,其计算基础是弹性分布式数据集,也就是RDD。通...
分类:其他好文   时间:2014-09-12 11:27:23    阅读次数:293
服务器CPU
服务器CPU服务器CPU,顾名思义,就是在服务器上使用的CPU(CenterProcessUnit中央处理器)。接触过局域网络的读者一定,服务器是网络中的重要设备,要接受成千上万用户的访问,因此对服务器具有大数据量的快速吞吐、超强的稳定性、长时间运行等严格要求。所以才将CPU比喻成计算机..
分类:其他好文   时间:2014-09-12 10:20:44    阅读次数:189
大数据的未来--个人信息/情报/认知服务的思考
1.未来大数据的一切都都关于人 ...不论述2.大数据收集困难和高风险现在的大数据的来源,都是通过自有平台收集用户数据的,对于没有平台的企业很难有机制和渠道获取稳定的数据来源,有说通过法律和制度来,规范关于人的大数据使用,在这之前,唯一可行的方向是,把用户大数据使用,做成服务的必选功能,要使用服务....
分类:其他好文   时间:2014-09-11 18:52:52    阅读次数:233
大数据环境下的数据库架构
随着数据的快速增长,分表,分库,memcache,redis,mongodb,hadoop,bigtable等,各种解决方案呼之欲出。经过测试,在MySQL中,无论如何加索引,数据超过百w时,查询起来耗时很明显。因此mysql分表分库+memcache+redis也不失是一个完美解决方案。由于red...
分类:数据库   时间:2014-09-11 15:14:22    阅读次数:325
了解一下大数据
项目开发针对的主要是企业家的应用,所以数据量算不上大数据,但是最近大数据在互联网行业的使用,作为一名程序员,应该学习新技术吗?但是学习他仅仅是为了借鉴一下大数据的处理思想,实现的过程,针对的场景,以便在我们的项目开发中借鉴一些思想,提高开发水平。===========================...
分类:其他好文   时间:2014-09-11 07:40:51    阅读次数:189
巧用 Hive 模拟分布式 grep
grep 由于内置高效的字符串搜索算法,兼容各种风格的正则,且功能众多,有着 linux 下字符串处理三剑客之一的称号,但是到了如今的大数据/分布式时代,这种单机时代的工具显得有些廉颇老矣。。。 1、需求背景 我们...
分类:其他好文   时间:2014-09-11 04:33:02    阅读次数:670
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!