搜索关键字：大数据开发 Hadoop Spark，搜索到19831个结果！码迷,mamicode.com！

hadoop的eclipse插件

我使用的hadoop是2.9.2版本的，对应的eclipse插件也要使用2.9.2的，我自己编译了一份，上传到了百度网盘，下载地址如下：链接：https://pan.baidu.com/s/11uM1tSeu-1zdTQrydfX5QA 提取码：p6y9 把插件放到eclipse的plugins目 ...

分类：系统相关时间：2020-04-04 11:55:57 阅读次数：69

Spark ml pipeline - transforming feature - StringIndexer

在spark ml pipeline的特征提取和转换阶段，有一种transformer可以将机器学习训练数据中常见的字符串列（例如表示各种分类）转换为数值索引列，以便于计算机处理。它就是StringIndexer。它支持的索引范围为[0, numLabels)（不支持的会编码为numLabels）， ...

分类：其他好文时间：2020-04-04 09:34:33 阅读次数：69

在Centos7.6上搭建Hadoop环境时安装jdk1.8，java：未找到命令

首先卸载Centos本身自带的openjdk，我参考的这位博主的安装教程 https://www.cnblogs.com/happyflyingpig/p/8068020.html 安装Hadoop环境，我参考的是这位博主的安装教程 https://blog.csdn.net/frank409167 ...

分类：编程语言时间：2020-04-03 21:48:00 阅读次数：238

Linux添加环境变量到PATH的方法

Centos Linux添加环境变量到PATH的方法在 Linux CentOS 系统上安装完 Hadoop 后，为了使用方便，需要将 Hadoop 命令加到系统命令中，如果在没有添加到环境变量之前，执行“hadoop fs”命令时，则会提示命令不存在的错误，如下所示：方法一1. export P ...

分类：系统相关时间：2020-04-03 19:56:56 阅读次数：89

spark streaming不同模式配置

背景 1）试试本地模式的spark streaming 2）试试yarn模式的spark streaming 1、本地模式的spark streaming 代码如下： package com.hxh import org.apache.spark.SparkConf import org.apach ...

分类：其他好文时间：2020-04-03 19:55:21 阅读次数：63

视频处理工具 FFmpeg 常用实例详解

FFmpeg 是一个专业的多媒体框架，能够解码、编码、转码、复用、解复用、流式传输、过滤和播放几乎所有格式的媒体文件。其核心就是 FFmpeg 程序本身，是一个基于命令行的视频和音频处理工具，多用于视频转码、基础编辑（修剪和合并）、视频缩放、后期效果制作等场景。这里通过一些示例简单地介绍下 ff ...

分类：其他好文时间：2020-04-03 13:46:00 阅读次数：76

scala spark dataframe 修改字段类型

package classifierAlg import config.conf.{sc, spark_session} import config.conf.spark_session.implicits._ import org.apache.spark.sql.functions._ impo ...

分类：其他好文时间：2020-04-03 12:32:15 阅读次数：282

Hadoop简介

1.Hadoop的发展历史起源介绍 a.Hadoop最早起源于Nutch、Nutch的设计目标是构建一个大型的全网搜索引擎，包括网页抓取、索引、查询的功能，但随着抓取网页数量的增加，遇到了严重的可扩展的问题——如何解决数10亿网页的存储和索引问题。 b.2003、2004年谷歌发表的两篇论文为该问题 ...

分类：其他好文时间：2020-04-03 12:26:15 阅读次数：105

Spark读取mysql数据库实例

1.Spark可以读取多种数据源，本实例为读取mysql. 2.准备工作： sacla，idea，mysql-connector-java，版本从：https://mvnrepository.com/获取 3.代码示例： object WordFreq { def main(args: Array[ ...

分类：数据库时间：2020-04-03 11:55:22 阅读次数：92

Hadoop搭建高可用的HA集群

一、工具准备 1、7台虚拟机（至少需要3台），本次搭建以7台为例，配好ip,关闭防火墙，修改主机名和IP的映射关系（/etc/hosts），关闭防火墙 2、安装JDK,配置环境变量二、集群规划：集群规划（7台）：主机名 IP 安装的软件运行的进程 hadoop01 192.168.*.121 ...

分类：其他好文时间：2020-04-03 00:25:12 阅读次数：82

共19831条上一页 1 ... 97 98 99 100 101 ... 1984 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)