搜索关键字：spark 大数据 hadoop docker，搜索到46925个结果！码迷,mamicode.com！

hadoop多次格式化后，导致datanode启动不了，怎么办？（伪分布式）

根据当初 hadoop 安装目录下 conf 目录的 core-site.xml 的设置，找到该目录：进入该目录在 data 和 name 文件夹下均有 current 文件夹，和 current 文件夹下有 VERSION 文件主要要做的是使这两个文件中的 namespaceID 相同接下来就是...

分类：其他好文时间：2014-05-09 05:15:30 阅读次数：305

Apache Spark源码走读之6 -- 存储子系统分析

Spark计算速度远胜于Hadoop的原因之一就在于中间结果是缓存在内存而不是直接写入到disk，本文尝试分析Spark中存储子系统的构成，并以数据写入和数据读取为例，讲述清楚存储子系统中各部件的交互关系。

分类：其他好文时间：2014-05-09 05:14:32 阅读次数：405

大数据科普

转自 http://www.cstor.cn/textdetail_6531.html

分类：其他好文时间：2014-05-09 03:37:49 阅读次数：201

在eclipse中配置spark 0.9.1源码的开发环境

一、准备工作： 1、下载release版spark 0.9.1，本次用的版本是spark-0.9.1-bin-cdh4。 2、下载scala IDE 3.0.2，这个版本ide的支持scala 2.10版。二、配置工作 1、在ide中新建scala项目，注意jre要用jdk1.7版的。如下图： 2...

分类：系统相关时间：2014-05-09 03:27:34 阅读次数：512

基于HBASE的并行计算架构之rowkey设计篇

1.大数据在HBASE存储、计算以及查询的应用场景海量数据都是事务数据，事务数据都是在时间的基础上产生的。数据的业务时间可能会顺序产生，也可能不会顺序产生，比如某些事务发生在早上10点，但是在下午5点才结束闭并生成出来，这样的数据就会造成存储加载时的时间连续性。另外海量数据的挖掘后产生的是统计数据，...

分类：其他好文时间：2014-05-09 03:03:39 阅读次数：347

基于HBase的手机数据备份系统

基于HBase实现的手机数据备份系统，实现了手机关键信息的备份，如短信、联系人等。包括服务器端(Server)和客户端(Client) Server运行环境：Hadoop+HBase+Tomcat Client运行环境: Eclipse+Android2.3 ----------------------------------------------------- ...

分类：移动开发时间：2014-05-08 16:07:49 阅读次数：390

Task的执行过程分析

Task的执行过程分析 Task的执行通过Worker启动时生成的Executor实例进行， caseRegisteredExecutor(sparkProperties)=> logInfo("Successfullyregistered with driver") //Make this host instead of hostPort ? executor= newExecuto...

分类：其他好文时间：2014-05-08 16:01:31 阅读次数：667

《大型网站技术架构》1：概述

参考自《大型网站技术架构》第1~3章 1、大型网站架构演化发展历程（1）初始阶段的网站架构：一台服务器分别作为应用、数据、文件服务器（2）应用服务和数据服务分离：三台服务器分别承担上述三项工作，其中应用服务器要求CPU强大、数据库服务器需求更快的硬盘和内存，文件服务器需要较大的硬盘。（3）使用缓存改善网站性能：分为本地缓存以及缓存在专门的分布式服务器上的远程缓存。（4）使...

分类：Web程序时间：2014-05-08 04:42:48 阅读次数：430

高精度之大数除法

高精度之大数的除法，大数据计算c语言一样强大...

分类：其他好文时间：2014-05-08 04:27:19 阅读次数：281

Pig源码分析: 简析执行计划的生成

本文通过跟代码的方式，分析从输入一批Pig-latin到输出物理执行计划（与launcher引擎有关，一般是MR执行计划，也可以是Spark RDD的执行算子）的整体流程。不会具体涉及AST如何解析、如何使用了Anltr、逻辑执行计划如何映射、逻辑执行计划如何优化、MR执行计划如何切分为MR Job，而是从输入一批Pig DSL到待执行的真正执行计划的关键变化步骤（方法和类）。...

分类：其他好文时间：2014-05-08 04:00:42 阅读次数：407

共46925条上一页 1 ... 4678 4679 4680 4681 4682 ... 4693 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)