搜索关键字：spark 大数据 hadoop spark-sql，搜索到29965个结果！码迷,mamicode.com！

开源项目记录

数据存储 MongoDb 针对大数据量、高并发、弱事务的互联网应用 MemCache 简单的key-value存储，读取内存，效率高 Redis 可存储list，持久化，内存读取效率高 Cassandra 分布式数据库，更好的扩展性，对大数据更好的支持 http://www.ibm...

分类：其他好文时间：2014-07-15 08:00:42 阅读次数：220

(转)NoSQL系列：选择合适的数据库

内容目录：为什么使用NoSQL数据库？键值数据库文档数据库列族数据库图数据库附思维导图参考NoSQL系列：选择合适的数据库为什么使用NoSQL数据库？阻抗失衡关系模型和内存中的数据结构不匹配采用更为方便的数据交互方式提升开发效率待处理的数据量很大数据量超过关...

分类：数据库时间：2014-07-15 00:40:27 阅读次数：388

WebService处理大数据量数据

在通过WebService处理大数据量数据时出现如下错误：soap fault: 运行配置文件中指定的扩展时出现异常。 ---> 超过了最大请求长度。解决方法：因为上传的文件大于系统默认配置的值，asp.net web service默认的请求长度是4M。1、针对单个项目，只需修改Web.confi...

分类：Web程序时间：2014-07-14 23:28:05 阅读次数：249

高效搭建Spark完全分布式集群

本文详细总结Spark分布式集群的安装步骤，帮助想要学习Spark的技术爱好者快速搭建Spark的学习研究环境。...

分类：其他好文时间：2014-07-14 17:17:25 阅读次数：289

HBase 实战(1)--HBase的数据导入方式

前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇博文重点讲解HBase的数据导入, 描述三种方式, Client API, Bulkload, 以及Hive Over .....

分类：其他好文时间：2014-07-14 15:51:39 阅读次数：288

关于webservice大数据量传输时的压缩和解压缩

当访问WebSerivice时,如果数据量很大,传输数据时就会很慢。为了提高速度，我们就会想到对数据进行压缩。首先我们来分析一下。当在webserice中传输数据时，一般都采用Dataset进行数据传输。执行的过程就是先把Dataset转化为xml进行传输，Dataset转化为xml的格式如下：[...

分类：Web程序时间：2014-07-14 15:40:01 阅读次数：309

Hadoop - YARN 通信协议

Hadoop YARN组件间的主要通信协议简介。...

分类：其他好文时间：2014-07-14 14:04:13 阅读次数：221

MapReduce源码分析之MapTask分析

前言 MapReduce的源码分析是基于Hadoop1.2.1基础上进行的代码分析。该章节会分析在MapTask端的详细处理流程以及MapOutputCollector是如何处理map之后的collect输出的数据。 map端的主要处理流程图1 MapTask处理流程图1所示为MapTask的主要代码执行流程，在MapTask启动后会进入入口run函数，根据是否使用...

分类：其他好文时间：2014-07-14 13:31:33 阅读次数：392

Hadoop - YARN 概述

Hadoop YARN 简介...

分类：其他好文时间：2014-07-14 13:13:55 阅读次数：329

Hadoop -YARN 应用程序设计概述

Hadoop YARN ApplicationMaster程序设计概述。...

分类：其他好文时间：2014-07-14 11:27:32 阅读次数：267

共29965条上一页 1 ... 2904 2905 2906 2907 2908 ... 2997 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)