码迷,mamicode.com
首页 >  
搜索关键字:大数据 spark    ( 18881个结果
Spark1.0.0生态圈一览
Spark生态圈,也就是BDAS(伯克利数据分析栈),是伯克利APMLab实验室精心打造的,力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成,来展现大数据应用的一个平台,其核心引擎就是Spark,其计算基础是弹性分布式数据集,也就是RDD。通过Spark生态圈,AMPLab运用大数据、云计算、通信等各种资源,以及各种灵活的技术方案,对海量不透明的数...
分类:其他好文   时间:2014-06-11 06:59:31    阅读次数:288
Linux环境编程之共享内存区(一):共享内存区简介
共享内存区是可用IPC形式中最快的。一旦内存区映射到共享它的进程的地址空间,进程间数据的传递就不再涉及内核。然而往该共享内存区存放信息或从中取走信息的进程间通常需要某种形式的同步。不再涉及内核是指:进程不再通过执行任何进入内核的系统调用来彼此传递数据。内核必须建立允许各个进程共享该内存区的内存映射关系,然后一直管理内存区。 默认情况下通过fork派生的子进程并不与其父进程共享内存区。 mmap...
分类:系统相关   时间:2014-06-11 06:34:25    阅读次数:439
ajax大数据导入的一系列问题处理
介绍:就是想实现简单的ajax上传数据,但是当数据量较大的时候,问题就一个一个接着来了,其实数据也不是很大,就是csv格式数据 不到5w条数据。大小5M,一开始认为这个很简单,就是先上传一下文件,然后读取一下,存到数据库就好了,结果,可能我比较菜,弄了半天做出这个功能。环境是linux.遇到的问题就...
分类:其他好文   时间:2014-06-10 21:04:08    阅读次数:266
Spark1.0.0属性配置
1:Spark1.0.0属性配置方式       Spark属性提供了大部分应用程序的控制项,并且可以单独为每个应用程序进行配置。       在Spark1.0.0提供了3种方式的属性配置: SparkConf方式 SparkConf方式可以直接将属性值传递到SparkContext;SparkConf可以对某些通用属性直接配置,如master使用setMaster,...
分类:其他好文   时间:2014-06-10 14:47:43    阅读次数:280
Sql server 大数据量插入速度慢或丢失数据解决办法
Sql server 大数据量插入速度慢或丢失数据解决办法...
分类:数据库   时间:2014-06-10 13:58:17    阅读次数:286
sqlserver 大数据量的insert、delete操作优化
http://blog.csdn.net/lanyuzhen/article/details/7547476--大批量导出orders表:insertDBCC DROPCLEANBUFFERSDBCC FREEPROCCACHEgoSET NOCOUNT ONBEGIN TRANSACTIONINS...
分类:数据库   时间:2014-06-10 12:59:43    阅读次数:269
大部头出版物排版软件
随着出版物电子排版方式的普及,大部头出版物的排版,越来越多的应用在人们的工作中。例如,惠普公司的打印机销往世界各地几百个国家,打印机使用手册至少需要出版100多种语言,印出的手册摞起来有1人多高。另外,波音飞机和大众汽车等公司的产品装配手册和使用手册也都是如此,都是上千页甚至是上万页的大数据排版。对于这种大部头出版物的排版,传统的方法非常繁琐且容易出错。而采用XML和XSL的数据与排版格式分离的排版方式,使得排版变得非常简单。这种排版软件就是将出版物的数据放在XML文件中,而将排版格式用XSL文件进行描述,...
分类:其他好文   时间:2014-06-10 07:27:48    阅读次数:215
用Map-Reduce的思维处理数据
Map-reduce是一种优雅的数据处理方式,本文通过三个例子介绍如何用python在linux的管道进行map-reduce编程,本文写的所有map-reduce程序都可以原封不动的放在Hadoop下运行,很容易在大数据集上扩展。
分类:其他好文   时间:2014-06-09 19:11:44    阅读次数:253
Spark源码系列(一)spark-submit提交作业过程
前言折腾了很久,终于开始学习Spark的源码了,第一篇我打算讲一下Spark作业的提交过程。有不明白Spark的原理的话,有另外一位大牛已经写了一个系列的Spark的源码分析了,大家可以去参考他的,他的过程图画得非常好,他写过的我可能就不写了,实在没办法比人家写得更好。下面给出他的地址: http:...
分类:其他好文   时间:2014-06-09 13:25:12    阅读次数:439
如何快速做一个山寨的实时“大数据”处理
前言为啥写这篇文章?因为我现在做的这套实时计算系统在公司里很难玩下去了。去年年初来到ctrip,主要就是做两个实时应用,一个是实时报警,功能是做出来了,但应用效果不好;一个是XXX(敏感应用,不敢写出来,以XXX代替),也是实现了功能需求,但想继续按自己的思路往下走是不可能了,我捉急的表达能力很难让...
分类:其他好文   时间:2014-06-09 13:02:27    阅读次数:676
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!