本博文介绍首先介绍直接选择排序,然后针对直接选择排序的缺点改进的“堆排序”,堆排序非常适合:数组规模非常大(数百万或更多) + 严格要求辅助空间的场景。
分类:
其他好文 时间:
2014-07-22 22:46:55
阅读次数:
1802
对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用。Hive是什么?Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,注意这里不是数据库。Hive可以看作是用户编程...
分类:
其他好文 时间:
2014-07-22 22:45:54
阅读次数:
257
我们已经进入了大数据处理时代,需要快速、简单的处理海量数据,企业邮箱服务也面临着大数据处理,海量数据处理的三个主要因素:大容量数据、多格式数据和速度。DMCTextFilter和HTMLFilter是由北京红樱枫软件有限公司研制和开发的纯文本抽出和HTML转换通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,快速抽出纯文本数据信息和转换成HTML文件。便于用户实现对多种文档数据资源信息进行统一管理,编辑,检索和浏览。...
分类:
其他好文 时间:
2014-07-22 00:09:35
阅读次数:
373
前段时间在做一个项目的时候,遇到了要通过WEB SERVICE从服务器上返回数据量比较大的DATASET,当然,除了显示在页面上以外,有可能还要用这些数据在客户端进行其它操作。查遍了网站的文章,问了一些朋友,也找了一些解决方法.众所周知,如果不用其它方法,直接从WEB SERVICE上传回一个10W...
分类:
Web程序 时间:
2014-07-22 00:06:35
阅读次数:
292
我们已经进入了大数据处理时代,需要快速、简单的处理海量数据,企业邮箱服务也面临着大数据处理,海量数据处理的三个主要因素:大容量数据、多格式数据和速度。DMCTextFilter和HTMLFilter是由北京红樱枫软件有限公司研制和开发的纯文本抽出和HTML转换通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,快速抽出纯文本数据信息和转换成HTML文件。便于用户实现对多种文档数据资源信息进行统一管理,编辑,检索和浏览。...
分类:
其他好文 时间:
2014-07-22 00:06:35
阅读次数:
372
Mahout0.9+Hadoop-2.2.0贝叶斯分类纯java实战代码,希望能给搞大数据数据挖掘的java粉们有所帮助,也希望大家提出建议。也希望Mahout社区大牛,帮忙看看我遇到的问题,先在这里谢过了。。...
分类:
其他好文 时间:
2014-07-21 22:47:27
阅读次数:
365
本文讲解了大数据聚类算法中的一种clara.并通过matalb实例代码实现验证算法...
分类:
其他好文 时间:
2014-07-21 22:28:27
阅读次数:
248
Distinct Subsequences
A subsequence of a given sequence is just the given sequence with some elements (possibly none) left out. Formally, given a sequence X = x1x2…xm,
another sequence Z = z1...
分类:
其他好文 时间:
2014-07-21 15:44:16
阅读次数:
244
1. 前言2. 参考资料链接3. 使用介绍
3.1. 基本概念3.2. Tokyo Cabinet 简介3.3. 性能介绍3.4. tokyotyrant和Memcached的优势比较
3.4.1. 故障转移3.4.2. 日志文件体积小3.4.3. 超大数据量下表现出色
3.5. 安装
3.5.1. 编译安装tokyocabinet数据库3.5.2. 编译安装tokyotyra...
分类:
Web程序 时间:
2014-07-21 15:36:05
阅读次数:
471
今天说点题外话,说一说郭敬明和他的《小时代》,我知道大家会觉得这斯和大数据有毛关系,不过细细琢磨这里的道道或许也有值得我们这些做企业或职场的朋友深思和借鉴的东西。冯小刚拍了N部贺岁片总票房不过30亿,张艺谋到现在总票房也就20亿,但初出茅庐跨界做导演的小郭拍了《小..
分类:
其他好文 时间:
2014-07-21 12:45:53
阅读次数:
200