Hadoop 的优势
Hadoop 是 一 个 能 够 让 用 户 轻 松 架 构 和 使 用 的 分 布 式 计 算 平 台。 用 户 可 以 轻 松 地 在Hadoop 上开发运行处理海量数据的应用程序。它主要有以下几个优点:
1.高可靠性。Hadoop 按位存储和处理数据的能力值得人们信赖。
2.高扩展性。Hadoop 是在可用的计算机集簇间分配数据完成计算任务的, 这些集簇可以方便地...
分类:
其他好文 时间:
2014-05-22 12:26:27
阅读次数:
217
Java实现的一个词频统计程序,考虑海量数据应该怎么做?MapReduce?!...
分类:
编程语言 时间:
2014-05-22 11:29:46
阅读次数:
361
这篇文章不提原理,讲讲hadoop及其周边项目的作用。
hadoop这个词已经流行好多年了,一提到大数据就会想到hadoop,那么hadoop的作用是什么呢?
官方定义:hadoop是一个开发和运行处理大规模数据的软件平台。核心词语是平台,也就是说我们有大量的数据,又有好几个电脑,我们知道应该把处理数据的任务分解到各个电脑上,但是不知道怎样分配任务,怎样回收结果,hadoop大概就帮助我们做了...
分类:
其他好文 时间:
2014-05-22 10:34:39
阅读次数:
288
代志远早年就职网易研究院从事MapReduce与DFS系统的自主研发,后加入支付宝数据平台负责Hadoop与HBase体系的架构设计与二次研发,支付宝流计算与分布式搜索系统的设计和研发,后成为支付宝海量计算体系架构师兼支付宝三代架构成员。现就转战于阿里巴巴集团-CDO-海量数据部门,负责创新性项目的研究和跟进,目前专注于Google第二代数据库产品MegaStore的研究和在阿里的落地。
在...
分类:
数据库 时间:
2014-05-21 17:04:40
阅读次数:
393
摘要:因安装不安全的手机App而导致的用户隐私被泄露的事件屡见报端,致使手机App频现“偷窥门”,让越来越多的人为之心惊胆跳。
安卓平台海量的免费应用吸引了越来越多的用户,但其开放性也给用户的隐私安全带来隐患,因安装不安全的手机App导致隐私泄露的事件屡屡被曝光。据统计,5%的免费移动应用都含有侵犯用户隐私的广告软件。这些广告软件可以更改用户手机设置、发送通知消息、私自访问用户身份信息等等。...
分类:
移动开发 时间:
2014-05-21 14:30:34
阅读次数:
280
测试的流程:需求阶段流程图:单元/集成测试阶段流程图系统测试阶段流程图压力测试流程图性能测试流程图仅仅了解就够复杂的了,实际操作过程中的问题肯定更多。像压力测试、性能测试,一般的情况下我哪里用得上埃虽然也知道些什么分布式应用、海量存储之类的,但是我连1T的数据..
分类:
其他好文 时间:
2014-05-21 02:09:10
阅读次数:
402
迭代器模式和组合模式混用前言
园子里说设计模式的文章算得上是海量了,所以本篇文章所用到的迭代器设计模式和组合模式不提供原理解析,有兴趣的朋友可以到一些前辈的设计模式文章上学学,很多很有意思的。在Head
First 设计模式这本书中,也有说迭代和组合模式混用的方法,但是使用的语言是JAVA,实现起....
分类:
其他好文 时间:
2014-05-19 13:37:27
阅读次数:
409
说明MapReduce是一种分布式计算模型,解决海量数据的计算问题,主要有Map和Reduce组成用户使用时需要实现map()和reduce()两个函数,两个函数的形参都是key/value键值对若以eclipse为开发环境,运行时出现内存不足的情况,需要修改虚拟机的参数
(例如把Default V...
分类:
其他好文 时间:
2014-05-19 11:56:18
阅读次数:
352
链接:http://www.uml.org.cn/sjjm/201308264.asp高并发数据库可以同时处理海量信息,应用范围很广。今天我们将讨论的是大数据量高并发的数据库优化,希望对大家有所帮助。一、数据库结构的设计如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难...
分类:
数据库 时间:
2014-05-18 20:30:59
阅读次数:
519
比较Java原生的 3种Map的效率。 1. TreeMap 2. HashMap 3.
ConcurrentSkipListMap 结果: 模拟150W以内海量数据的插入和查找,通过增加和查找两方面的性能测试,结果如下: Map类型 插入
查找(在100W数据量中) ...
分类:
编程语言 时间:
2014-05-15 22:44:30
阅读次数:
556