码迷,mamicode.com
首页 >  
搜索关键字:大数据开发 Hadoop Spark    ( 19831个结果
国内大数据企业排名
数据仓库及管理——星环 Transwarp - 首页星环主要从事大数据时代核心平台数据库软件的研发与服务,是唯一被Gartner列为国际主流Hadoop发行版厂商。其产品Transwarp Data Hub提供高速SQL引擎Transwarp Inceptor, No...
分类:其他好文   时间:2020-10-24 11:51:18    阅读次数:41
Spark ML 之 ALS内存溢出的解决办法
原帖:https://blog.csdn.net/Damonhaus/article/details/76572971 问题:协同过滤 ALS算法。在测试过程中遇到了内存溢出的错误 解决办法1:降低迭代次数,20次 -> 10次 val model = new ALS().setRank(10).s ...
分类:其他好文   时间:2020-10-24 09:45:55    阅读次数:24
Hadoop框架:DataNode工作机制详解
DataNode上数据块以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是数据块元数据包括长度、校验、时间戳; DataNode启动后向NameNode服务注册,并周期性的向NameNode上报所有的数据块元数据信息;
分类:其他好文   时间:2020-10-21 20:51:41    阅读次数:21
linux系统层面调优和常见的面试题
无论对Spark集群,还是Hadoop集群等大数据相关的集群进行调优,对linux系统层面的调优都是必不可少的,这里主要介绍3种常用的调优和linux常见面试题 ...
分类:系统相关   时间:2020-10-20 16:23:11    阅读次数:36
Spark ML 特征处理类之 VectorAssembler 向量装配转换器/VectorIndexer
一、VectorAssembler package com.home.spark.ml import org.apache.spark.SparkConf import org.apache.spark.ml.feature.VectorAssembler import org.apache.spa ...
分类:其他好文   时间:2020-10-18 09:57:35    阅读次数:15
4.Hadoop安装 与 HDFS体系结构
1.用自己的图,描述HDFS体系结构、工作原理与流程。 2.伪分布式安装Hadoop (1)创建hadoop用户 (2)更新apt (3)安装SSH ,配置无密码SSH登录 (4)安装JAVA环境 (5)安装 Hadoop 2.7.1 (6)Hadoop伪分布式配置 (7)运行Hadoop伪分布式实 ...
分类:其他好文   时间:2020-10-18 09:54:43    阅读次数:16
CentOS8系统安装Hadoop-3.2.1伪分布式配置
实验目的 ? 在 Linux(VM15pro/CentOS8) 环境下完成Hadoop-3.2.1伪分布式环境的搭建,并运行 Hadoop 自带的 WordCount 实例检测是否运行正常。 一、下载并配置java环境 ? Java 环境可选择 Oracle 的 JDK,或是 OpenJDK,现在一 ...
分类:其他好文   时间:2020-10-18 09:51:46    阅读次数:25
Ubuntu上的Hbase集群搭建
到http://mirror.bit.edu.cn/apache/hbase/下载对应的Hbase版本 我这里下载的是hbase-2.2.6-bin.tar.gz版本,是较稳定的版本。 解压: tar -zxvf /home/hadoop/桌面/hbase-2.2.6-bin.tar.gz 移动位置 ...
分类:系统相关   时间:2020-10-18 09:47:54    阅读次数:26
【BAT面试通关手册】覆盖Java相关29个技能,学完之后吊打面试官!
这是一份涵盖了Java相关29个技能的Java架构进阶学习资料,绝对是全网最好全完整的一个学习文档资料了。下面给大家介绍一下这份【BAT面试手册】都有哪些知识点的详细解析。 需要领取完整版的老铁请转发+关注,然后添加我的VX(tkzl6666)获得免费领取方式! 1、JVM 线程 JVM内存区域 J ...
分类:编程语言   时间:2020-10-16 10:27:24    阅读次数:24
2020 秋招 阿里巴巴大数据面试 带答案!
猫场面试题第 1 套 以下为我为大家整理的猫场面试题第一套,均为笔者自己参加面试或者一些读者分享给我的题目,保证真实和准确性。 1 框架部分 1.1 Spark 提交 job 流程 所谓提交流程,其实就是我们开发人员根据需求写的应用程序通过 Spark 客户端提交给 Spark 运行环境执行计算的流 ...
分类:其他好文   时间:2020-10-13 17:19:39    阅读次数:26
19831条   上一页 1 ... 31 32 33 34 35 ... 1984 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!