搜索关键字：spark 大数据 hadoop spark-sql，搜索到29965个结果！码迷,mamicode.com！

hadoop多次格式化后，导致datanode启动不了，怎么办？（伪分布式）

根据当初 hadoop 安装目录下 conf 目录的 core-site.xml 的设置，找到该目录：进入该目录在 data 和 name 文件夹下均有 current 文件夹，和 current 文件夹下有 VERSION 文件主要要做的是使这两个文件中的 namespaceID 相同接下来就是...

分类：其他好文时间：2014-05-09 05:15:30 阅读次数：305

Apache Spark源码走读之6 -- 存储子系统分析

Spark计算速度远胜于Hadoop的原因之一就在于中间结果是缓存在内存而不是直接写入到disk，本文尝试分析Spark中存储子系统的构成，并以数据写入和数据读取为例，讲述清楚存储子系统中各部件的交互关系。

分类：其他好文时间：2014-05-09 05:14:32 阅读次数：405

大数据科普

转自 http://www.cstor.cn/textdetail_6531.html

分类：其他好文时间：2014-05-09 03:37:49 阅读次数：201

在eclipse中配置spark 0.9.1源码的开发环境

一、准备工作： 1、下载release版spark 0.9.1，本次用的版本是spark-0.9.1-bin-cdh4。 2、下载scala IDE 3.0.2，这个版本ide的支持scala 2.10版。二、配置工作 1、在ide中新建scala项目，注意jre要用jdk1.7版的。如下图： 2...

分类：系统相关时间：2014-05-09 03:27:34 阅读次数：512

基于HBASE的并行计算架构之rowkey设计篇

1.大数据在HBASE存储、计算以及查询的应用场景海量数据都是事务数据，事务数据都是在时间的基础上产生的。数据的业务时间可能会顺序产生，也可能不会顺序产生，比如某些事务发生在早上10点，但是在下午5点才结束闭并生成出来，这样的数据就会造成存储加载时的时间连续性。另外海量数据的挖掘后产生的是统计数据，...

分类：其他好文时间：2014-05-09 03:03:39 阅读次数：347

Hbase Python接口

http://wiki.apache.org/hadoop/Hbase/ThriftApi首先根据Hbase.thrift文件生成Python接口代码，Hbase.thrift在Hbase的源码中有，路径src/main/resources/org/apache/hadoop/hbase/thrif...

分类：编程语言时间：2014-05-09 02:51:31 阅读次数：344

[BZOJ3568]DZY Loves Math VII

本人BZOJ的处女作。这题题面还是蛮有趣的吧。然后三个问题都蛮有意思的。要保证正确性，出数据还是异常蛋疼啊。本来各出三题的。但是考虑到是OJ上的题，就搞在一起了。这样代码量就会比较大。

分类：其他好文时间：2014-05-08 23:47:58 阅读次数：846

基于HBase的手机数据备份系统

基于HBase实现的手机数据备份系统，实现了手机关键信息的备份，如短信、联系人等。包括服务器端(Server)和客户端(Client) Server运行环境：Hadoop+HBase+Tomcat Client运行环境: Eclipse+Android2.3 ----------------------------------------------------- ...

分类：移动开发时间：2014-05-08 16:07:49 阅读次数：390

Task的执行过程分析

Task的执行过程分析 Task的执行通过Worker启动时生成的Executor实例进行， caseRegisteredExecutor(sparkProperties)=> logInfo("Successfullyregistered with driver") //Make this host instead of hostPort ? executor= newExecuto...

分类：其他好文时间：2014-05-08 16:01:31 阅读次数：667

Pig源码分析: 简析执行计划的生成

本文通过跟代码的方式，分析从输入一批Pig-latin到输出物理执行计划（与launcher引擎有关，一般是MR执行计划，也可以是Spark RDD的执行算子）的整体流程。不会具体涉及AST如何解析、如何使用了Anltr、逻辑执行计划如何映射、逻辑执行计划如何优化、MR执行计划如何切分为MR Job，而是从输入一批Pig DSL到待执行的真正执行计划的关键变化步骤（方法和类）。...

分类：其他好文时间：2014-05-08 04:00:42 阅读次数：407

共29965条上一页 1 ... 2982 2983 2984 2985 2986 ... 2997 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)