码迷,mamicode.com
首页 >  
搜索关键字:hive on spark    ( 12366个结果
Hadoop入门学习
自己学习Hadoop时,整理的资料,方便以后查看,希望能帮到大家,有什么问题欢迎大家指出 一、Hadoop是什么?其核心又是什么? Hadoop历史 雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜 ...
分类:其他好文   时间:2020-07-23 22:35:14    阅读次数:65
Hadoop基础(四十六):DML 数据操作
1 数据导入 1.1 向表中装载数据(Load) 1.语法 hive> load data [local] inpath '/opt/module/datas/student.txt' [overwrite] into table student [partition (partcol1=val1, ...
分类:其他好文   时间:2020-07-22 20:27:55    阅读次数:71
hive 调优
1,hive架构 1)client,客户端 2)Driver:驱动器 3)解析器,编译器,优化器,执行器 4)底层默认使用mr作为数据处理引擎 5)元数据,通常配置mysql来存储,这样支持多个客户端的访问 2,hive和传统数据库的比较 相同之处:都拥有类似的查询语言 不同之处: 1)数据存储位置 ...
分类:其他好文   时间:2020-07-21 22:25:52    阅读次数:76
java Spark 读取hbase数据
引用的jar包(maven) <properties> <java.version>1.8</java.version> <ch.qos.logback.version>1.2.3</ch.qos.logback.version> <sharding-sphere.version>4.1.1</sh ...
分类:编程语言   时间:2020-07-21 21:58:23    阅读次数:74
Hive列操作汇总(添加/更新/删除/虚拟列)
官网语法如下所示https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-AlteringandDroppingTables ***注意:***REPLACE列 替换所有现有列,只更改表的模式,而不是 ...
分类:其他好文   时间:2020-07-21 09:46:44    阅读次数:105
(一)Spark
Spark基础入门 1、spark的核心概念 2、spark的四大特性 3、spark的整体架构 4、spark的集群安装部署 5、spark的集群的启动和停止 6、spark的集群web管理界面 7、spark-shell Driver 它会执行客户端写好的main方法,它会构建一个名叫Spark ...
分类:其他好文   时间:2020-07-21 09:31:03    阅读次数:90
[HIVE] Hive Commands的学习
什么是Hive: 数据仓库软件,可以通过SQL读写和管理分布式存储的大型数据集,结构可以映射在已经存储的数据。用户可以通过命令行工具和JDBC连接到Hive。 Hive Commands: quit/exit:退出interactive shell reset:重置配置设定到默认值。 set =:设 ...
分类:其他好文   时间:2020-07-21 01:27:08    阅读次数:119
MYSQL之存储引擎
mysql的文件系统 1.mysql提供的存储引擎 01)InnoDB 适合数据增删改查 02)MyISAM 存储一些只读的数据 03)MEMORY 支持hash索引 04)ARCHIVE 05)FEDERATED 06)EXAMPLE 07)BLACKHOLE 08)MERGE 09)NDBCLU ...
分类:数据库   时间:2020-07-20 22:53:18    阅读次数:113
azkaban工作流调度器
1、用途 一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序、hive脚本等 各任务单元之间存在时间先后及前后依赖关系 为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行; 例如,我们可能有这样一个需求,某个业务系统每天产生 ...
分类:其他好文   时间:2020-07-20 13:26:58    阅读次数:71
深入理解Spark Streaming
一.DStream的两类操作 DStream内部其实是RDD序列,所有的DStream操作最终都转换为RDD操作。通过分析源码,可以进一步窥探这种转换是如何进行的。 DStream有一些与RDD类似的基础属性: 依赖的其它DStream列表。 生成RDD的时间间隔。 一个名为compute的计算函数 ...
分类:其他好文   时间:2020-07-20 13:13:18    阅读次数:64
12366条   上一页 1 ... 33 34 35 36 37 ... 1237 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!