码迷,mamicode.com
首页 >  
搜索关键字:大数据开发 Hadoop Spark    ( 19831个结果
java 基础
java语言的特点 跨平台性(操作系统); 面向对象; 简单性; 健壮性 垃圾回收,异常处理; 多线程; 大数据开发相关; JVM java virtual machine虚拟机; 内存中开辟一块空间;源文件 编译 字节码; java计算机高级编程语言 程序存储在哪里? 程序就是英文 存储在一个地方 ...
分类:编程语言   时间:2020-04-25 09:14:59    阅读次数:60
4、flink自定义source、sink
一、Source 代码地址:https://gitee.com/nltxwz_xxd/abc_bigdata 1.1、flink内置数据源 1、基于文件 env.readTextFile("file://path") env.readFile(inputFormat, "file://path"); ...
分类:其他好文   时间:2020-04-24 21:42:02    阅读次数:85
如何将mysql数据导入hive中
1.首先在hive中建表(尽量与mysql字段对应) 2. 将mysql中的表导出 txt格式 3.通过hadoop 上传到HDFS上 命令 hadoop dfs -put /home/hadoop/dim_station_trans_com_info.txt /user/hive/external ...
分类:数据库   时间:2020-04-24 18:41:58    阅读次数:109
Java面试题(多线程篇)
35.并行和并发有什么区别? 1.并行是指两个或者多个事件在同一时刻发生;而并发是指两个或多个事件在同一时间间隔发生。 2.并行是在不同实体上的多个事件,并发是在同一实体上的多个事件。 3.在一台处理器上“同时”处理多个任务,在多台处理器上同时处理多个任务。如hadoop分布式集群。 所以并发编程的 ...
分类:编程语言   时间:2020-04-24 14:32:30    阅读次数:67
Hadoop学习之运行官方案例
Hadoop的官方案例都在mapreduce.jar文件夹中,提供了mapreduce的基本功能,可用于计算,eg:pi值,计算文档中的字数等 官方案例都在 hadoop-mapreduce-examples-2.7.3.jar 这个jar包中。 命令:hadoop jar ./hadoop-2.7 ...
分类:其他好文   时间:2020-04-24 01:40:56    阅读次数:107
Spark中自定义累加器
通过继承AccumulatorV2可以实现自定义累加器。 官方案例可参考:http://spark.apache.org/docs/latest/rdd-programming-guide.html#accumulators 下面是我自己写的一个统计卡种数量的案例。 package com.shua ...
分类:其他好文   时间:2020-04-24 00:55:29    阅读次数:84
Spark实现tf-idf
scala代码: package offline import org.apache.spark.ml.feature.{HashingTF, IDF} import org.apache.spark.ml.linalg.Vectors import org.apache.spark.sql.Spa ...
分类:其他好文   时间:2020-04-23 21:27:31    阅读次数:67
Spark SQL源码解析(二)Antlr4解析Sql并生成树
Spark SQL原理解析前言: "Spark SQL源码剖析(一)SQL解析框架Catalyst流程概述" 这一次要开始真正介绍Spark解析SQL的流程,首先是从Sql Parse阶段开始,简单点说,这个阶段就是使用Antlr4,将一条Sql语句解析成语法树。 可能有童鞋没接触过antlr4这个 ...
分类:数据库   时间:2020-04-23 20:59:04    阅读次数:93
Windows 上运行 Hadoop WordCount 用例
1. 下载wordcount jar 文件 下载文件夹放置你的目录: https://github.com/yjy24/bigdata_learning/blob/master/hadoopMapRedSimple.zip 2. 启动 hadoop 管理员身份运行window cmd: 启动 Had ...
分类:Windows程序   时间:2020-04-23 20:54:03    阅读次数:262
Hadoop运行环境搭建
大概的流程具体如下: 1、修改主机名 2、关闭防火墙 3、安装JDK并配置环境变量 4、安装Hadoop并配置环境变量 上面每个流程的具体操作如下: 一、修改主机名 1、修改主机名 根目录下输入如下代码: vim etc/hostname 然后把当前的主机名改掉,我改成了hadoop 2、修改lin ...
分类:其他好文   时间:2020-04-23 19:08:09    阅读次数:57
19831条   上一页 1 ... 88 89 90 91 92 ... 1984 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!