搜索关键字：textfile，搜索到261个结果！码迷,mamicode.com！

SparkSQL调优

1、执行计划（过往记忆https://www.iteblog.com/archives/2562.html） 2、逻辑计划优化方法：谓词下推，列裁剪，常量替换，常量累加 3、优化方法数据源方面： 1、hive 使用parquet格式，不要用textfile。列式存储便于查询引擎做块遍历、谓词下推 ...

分类：数据库时间：2019-06-18 23:01:37 阅读次数：303

HIVE 必知必会

hive：基于hadoop，数据仓库软件，用作OLAP OLAP：online analyze process 在线分析处理OLTP：online transaction process 在线事务处理事务： ACID A：atomic 原子性 C: consistent 一致性 I：isolat ...

分类：其他好文时间：2019-06-14 16:16:24 阅读次数：88

Spark transformation算子之coalesce&&repartition

详细讲解RDD中两个关于重新分区的算子coalesce和repartition~

分类：其他好文时间：2019-05-17 18:01:22 阅读次数：177

python运维开发常用模块(四)文件对比模块difflib

1.difflib介绍 difflib作为 Python的标准库模块，无需安装，作用是对比文本之间的差异，且支持输出可读性比较强的HTML文档，与Linux下的diff命令相似。我们可以使用difflib对比代码、配置文件的差别，在版本控制方面是非常有用。 Python 2.3或更高版本默认自带 ...

分类：编程语言时间：2019-05-13 14:19:32 阅读次数：158

Spark应用程序开发流程

配置文件:pom.xml 2.11.8 2.2.0 2.6.0-cdh5.7.0 cloudera cloudera https://repository.cloudera.com/artifactory/cloudera-repos/ org.scala-lang ... ...

分类：其他好文时间：2019-05-07 19:44:14 阅读次数：158

spark 2.4 java8 hello world

download JDK 8, extract and add to .bashrc: export JAVA_HOME=/home/bonelee/jdk1.8.0_211export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATHexpor ...

分类：编程语言时间：2019-04-23 12:58:25 阅读次数：198

hive中的文件格式的简介

【hive中的file_format】 SEQUENCEFILE：生产中绝对不会用，k-v格式，比源文本格式占用磁盘更多 TEXTFILE：生产中用的多，行式存储 RCFILE：生产中用的少，行列混合存储，OCR是他得升级版 ORC：生产中最常用，列式存储 PARQUET：生产中最常用，列式存储 A ...

分类：其他好文时间：2019-04-21 09:17:35 阅读次数：206

spark（一）：spark概览及逻辑执行图

上图是spark框架概要图，spark一些重要概念先简要介绍一下：clustermanager：资源管理集群，比如standalone、yarn；application：用户编写的应用程序；Driver：application中的main函数，创建的SparkContext负责与clustermanager通信，进行资源的申请、任务的分配与监控。一般认为SparkContext就是Driver；w

分类：其他好文时间：2019-04-20 17:02:21 阅读次数：151

SparkSQL之UDF使用

package cn.piesat.testimport org.apache.spark.sql.SparkSessionimport scala.collection.mutable.ArrayBufferobject SparkSQLTest { def main(args: Array[St ...

分类：数据库时间：2019-04-06 15:27:58 阅读次数：200

Hive对表建立索引

1.首先创建表 create table user( id int, name string, address string ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; 2.创建索引 create index ...

分类：其他好文时间：2019-03-23 16:18:23 阅读次数：229

共261条上一页 1 ... 6 7 8 9 10 ... 27 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)