数据存储 MongoDb 针对大数据量、高并发、弱事务的互联网应用 MemCache 简单的key-value存储,读取内存,效率高 Redis 可存储list,持久化,内存读取效率高 Cassandra 分布式数据库,更好的扩展性,对大数据更好的支持 http://www.ibm...
分类:
其他好文 时间:
2014-07-15 08:00:42
阅读次数:
220
上一章讲了什么是云,把云的概念给搭建简单的做了分析。这一章我把国内、国外的PaaS平台,即应用托管平台进行了测评对比,包括:国外的AWS、GAE和Windows Azure和国内的京东云擎JAE、百度BAE、新浪SAE、以及阿里云。IBM也宣布了落地国内的计划,IBM的公有云有好几套方案,一个是.....
分类:
其他好文 时间:
2014-07-15 00:49:29
阅读次数:
347
内容目录:为什么使用NoSQL数据库?键值数据库文档数据库列族数据库图数据库附思维导图参考NoSQL系列:选择合适的数据库为什么使用NoSQL数据库?阻抗失衡 关系模型和内存中的数据结构不匹配 采用更为方便的数据交互方式提升开发效率 待处理的数据量很大 数据量超过关...
分类:
数据库 时间:
2014-07-15 00:40:27
阅读次数:
388
在通过WebService处理大数据量数据时出现如下错误:soap fault: 运行配置文件中指定的扩展时出现异常。 ---> 超过了最大请求长度。解决方法:因为上传的文件大于系统默认配置的值,asp.net web service默认的请求长度是4M。1、针对单个项目,只需修改Web.confi...
分类:
Web程序 时间:
2014-07-14 23:28:05
阅读次数:
249
云计算在当今IT世界中已发展地如火如荼,越来越多的企业利用云计算改造传统的数据中心,简化IT资源的交付模式。云计算是许多开放技术的融合,在这个领域,OpenStack是其中最流行最具影响力的开源IaaS云平台,全世界大批的工程师参与OpenStack各组件的开发,使其社区越来越活跃,发展也越来越快速...
分类:
其他好文 时间:
2014-07-14 22:34:30
阅读次数:
372
本文详细总结Spark分布式集群的安装步骤,帮助想要学习Spark的技术爱好者快速搭建Spark的学习研究环境。...
分类:
其他好文 时间:
2014-07-14 17:17:25
阅读次数:
289
选择传智播客九大理由:
1 有实力不怕炫,我们就爱那个是出书出开源项目
2 引领新技术,让我们学员走在别人最前面,首家推出Hadoop,Unity3D,Nginx。
3 课程知识面广,技术讲解深入易懂,让我们学员不仅会做,还能明白其中原理。
4 培养学员自己解决问题的能力,拒绝成为“只会点击控件”的工具使用者。
5 终结“行尸走肉”的生活,带您走上“积极向上,充满理想”的人生道路。
6...
分类:
编程语言 时间:
2014-07-14 17:12:55
阅读次数:
261
前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇博文重点讲解HBase的数据导入, 描述三种方式, Client API, Bulkload, 以及Hive Over .....
分类:
其他好文 时间:
2014-07-14 15:51:39
阅读次数:
288
当访问WebSerivice时,如果数据量很大,传输数据时就会很慢。为了提高速度,我们就会想到对数据进行压缩。首先我们来分析一下。 当在webserice中传输数据时,一般都采用Dataset进行数据传输。执行的过程就是先把Dataset转化为xml进行传输,Dataset转化为xml的格式如下:[...
分类:
Web程序 时间:
2014-07-14 15:40:01
阅读次数:
309
前言 MapReduce的源码分析是基于Hadoop1.2.1基础上进行的代码分析。 该章节会分析在MapTask端的详细处理流程以及MapOutputCollector是如何处理map之后的collect输出的数据。 map端的主要处理流程
图1 MapTask处理流程 图1所示为MapTask的主要代码执行流程,在MapTask启动后会进入入口run函数,根据是否使用...
分类:
其他好文 时间:
2014-07-14 13:31:33
阅读次数:
392