搜索关键字：大数据 spark，搜索到18881个结果！码迷,mamicode.com！

集体智慧编程中相关章节对应论文数

准备开题报告了，先要熟悉一下领域范围，《集体智慧编程》参考一下论点。简单的思路是看一下哪个话题最热门，用google学术来衡量一下论文数，虽然不够精确但是足以反应一点什么。当然是选择最近比较热门的，同时参考一下国内的论文数目情况。关键字总的 2014 国内总数 2014 推荐 2,480,000 ...

分类：其他好文时间：2014-06-05 01:59:36 阅读次数：241

论文战略

最近论文实验进行的非常的不顺利，一方面是实验聚类的效果十分的差，另一方面是做大数据的实验对计算机的性能要求很高，非常的耗费内存，每当矩阵的维度大于3000的时候，整个计算机就像中了魔法似的，像蜗牛一样慢。这样用小数据做实验效果非常的差，用大数据做实验计算机又跑不动，搞的自己很愚昧，不知道是自己数据集的问题，还是聚类算法的问题。...

分类：其他好文时间：2014-06-03 05:54:21 阅读次数：263

Spark开源学习模块

Spark开源的各模块组成结构...

分类：其他好文时间：2014-06-03 04:07:29 阅读次数：263

Spark 1.0.0版本发布

前言今天Spark终于跨出了里程碑的一步，1.0.0版本的发布标志着Spark已经进入1.0时代。1.0.0版本不仅加入了很多新特性，并且提供了更好的API支持。Spark SQL作为一个新的组件加入，支持在Spark上存储和操作结构化的数据。已有的标准库比如ML、Streaming和GraphX也得到了很大程度上的增强，对Spark和Python的接口也变得更稳定。以下是几个主要的改进点...

分类：其他好文时间：2014-06-03 00:43:41 阅读次数：269

阿里巴巴曾鸣：数据时代来临

阿里巴巴集团总参谋长曾鸣大数据最重要的特征不在大小，而在死活。就企业而言，数据的死活决定一切，从数据的管理到数据的运用，数据必须能活起来，开始跑通迭代，才能产生持续价值。互联网将快速颠覆众多的传统行业。这两年，这样的话听多了，多少有些“狼来了”，让人逐渐麻木。可是，不经意间，出租车这个再传统不过的行业，一夜间就发生了巨大的变化，互联网究竟怎样细致而深刻地改变世界，逐渐清晰地展现在了...

分类：其他好文时间：2014-06-03 00:15:27 阅读次数：326

scala 语法要点

前段时间看了下scala做了下笔记，为后续看spark做点准备，笔记内容见图片。...

分类：其他好文时间：2014-06-01 15:35:40 阅读次数：182

普林斯顿公开课算法1-8：并查集快速查找

本节讲的是并查集的第一种实现方法，这种方法查找操作开销很小而合并操作开销比较大。数据结构假设有N个节点，那么该算法的数据结构就是一个包含N个整数的数组id[]。判断操作判断节点p和节点q是否相连就是判断id[p]和id[q]的值是否一致。合并操作合并节点p和节点q就是将id数组中所有的id[...

分类：其他好文时间：2014-06-01 14:55:21 阅读次数：202

普林斯顿公开课算法1-9：并查集-快速合并

本节讲的是并查集的另外一种实现方法。这种方法的合并操作开销很小，但是查找操作开销很大。数据结构这种算法的数据结构和快速查找方法的数据结构是一样的，也是N个整数组成的数组。数组中每个元素id[i]的含义是指i的上级是id[i]。根节点一个节点的根节点就是id[id[id[...id[i]....]]]，一直循...

分类：其他好文时间：2014-06-01 14:52:52 阅读次数：225

使用python操作elasticsearch实现数据插入分析

前言：例行公事，有些人可能不太了解elasticsearch，下面搜了一段，大家瞅一眼。Elasticsearch是一款分布式搜索引擎，支持在大数据环境中进行实时数据分析。它基于ApacheLucene文本搜索引擎，内部功能通过ReSTAPI暴露给外部。除了通过HTTP直接访问Elasticsearch，还可以通过支..

分类：编程语言时间：2014-06-01 13:47:42 阅读次数：328

Spark 1.0.0 横空出世 Spark on yarn 部署(hadoop 2.4)

就在昨天，北京时间5月30日20点多。Spark 1.0.0终于发布了：Spark 1.0.0 released 根据官网描述，Spark 1.0.0支持SQL编写：Spark SQL Programming Guide 个人觉得这个功能对Hive的市场的影响很小，但对Shark冲击很大，就像win7和winXP的关系，自相残杀嘛? 这么着急的发布1.x 版是商业行为还是货真价实的体现，让我们拭目以待吧~~~~ 本文是CSDN-撸大湿原创，如要转载请注明出处，谢谢：http://blog.csdn.net...

分类：其他好文时间：2014-06-01 08:55:43 阅读次数：460

共18881条上一页 1 ... 1869 1870 1871 1872 1873 ... 1889 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)