搜索关键字：大数据开发 Hadoop Spark，搜索到19831个结果！码迷,mamicode.com！

java 基础

java语言的特点跨平台性（操作系统）；面向对象；简单性；健壮性垃圾回收，异常处理；多线程；大数据开发相关； JVM java virtual machine虚拟机；内存中开辟一块空间；源文件编译字节码； java计算机高级编程语言程序存储在哪里？程序就是英文存储在一个地方 ...

分类：编程语言时间：2020-04-25 09:14:59 阅读次数：60

4、flink自定义source、sink

一、Source 代码地址：https://gitee.com/nltxwz_xxd/abc_bigdata 1.1、flink内置数据源 1、基于文件 env.readTextFile("file://path") env.readFile(inputFormat, "file://path"); ...

分类：其他好文时间：2020-04-24 21:42:02 阅读次数：85

如何将mysql数据导入hive中

1.首先在hive中建表（尽量与mysql字段对应） 2. 将mysql中的表导出 txt格式 3.通过hadoop 上传到HDFS上命令 hadoop dfs -put /home/hadoop/dim_station_trans_com_info.txt /user/hive/external ...

分类：数据库时间：2020-04-24 18:41:58 阅读次数：109

Java面试题（多线程篇）

35.并行和并发有什么区别？ 1.并行是指两个或者多个事件在同一时刻发生；而并发是指两个或多个事件在同一时间间隔发生。 2.并行是在不同实体上的多个事件，并发是在同一实体上的多个事件。 3.在一台处理器上“同时”处理多个任务，在多台处理器上同时处理多个任务。如hadoop分布式集群。所以并发编程的 ...

分类：编程语言时间：2020-04-24 14:32:30 阅读次数：67

Hadoop学习之运行官方案例

Hadoop的官方案例都在mapreduce.jar文件夹中，提供了mapreduce的基本功能，可用于计算，eg:pi值，计算文档中的字数等官方案例都在 hadoop-mapreduce-examples-2.7.3.jar 这个jar包中。命令：hadoop jar ./hadoop-2.7 ...

分类：其他好文时间：2020-04-24 01:40:56 阅读次数：107

Spark中自定义累加器

通过继承AccumulatorV2可以实现自定义累加器。官方案例可参考:http://spark.apache.org/docs/latest/rdd-programming-guide.html#accumulators 下面是我自己写的一个统计卡种数量的案例。 package com.shua ...

分类：其他好文时间：2020-04-24 00:55:29 阅读次数：84

Spark实现tf-idf

scala代码： package offline import org.apache.spark.ml.feature.{HashingTF, IDF} import org.apache.spark.ml.linalg.Vectors import org.apache.spark.sql.Spa ...

分类：其他好文时间：2020-04-23 21:27:31 阅读次数：67

Spark SQL源码解析（二）Antlr4解析Sql并生成树

Spark SQL原理解析前言： "Spark SQL源码剖析（一）SQL解析框架Catalyst流程概述" 这一次要开始真正介绍Spark解析SQL的流程，首先是从Sql Parse阶段开始，简单点说，这个阶段就是使用Antlr4，将一条Sql语句解析成语法树。可能有童鞋没接触过antlr4这个 ...

分类：数据库时间：2020-04-23 20:59:04 阅读次数：93

Windows 上运行 Hadoop WordCount 用例

1. 下载wordcount jar 文件下载文件夹放置你的目录： https://github.com/yjy24/bigdata_learning/blob/master/hadoopMapRedSimple.zip 2. 启动 hadoop 管理员身份运行window cmd：启动 Had ...

分类：Windows程序时间：2020-04-23 20:54:03 阅读次数：262

Hadoop运行环境搭建

大概的流程具体如下： 1、修改主机名 2、关闭防火墙 3、安装JDK并配置环境变量 4、安装Hadoop并配置环境变量上面每个流程的具体操作如下：一、修改主机名 1、修改主机名根目录下输入如下代码： vim etc/hostname 然后把当前的主机名改掉，我改成了hadoop 2、修改lin ...

分类：其他好文时间：2020-04-23 19:08:09 阅读次数：57

共19831条上一页 1 ... 88 89 90 91 92 ... 1984 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)