码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
[Spark] pyspark insertInto 去重插入数据表
pyspark有个bug, 虽然下面代码写了 write.mode("overwrite")但是不生效 spark.conf.set("hive.exec.dynamic.partition.mode", "constrict") db_df.repartition(1).write.mode("o ...
分类:其他好文   时间:2021-02-23 14:14:20    阅读次数:0
数据的基本类型及扩展
数据的基本类型及扩展 1. 数据类型: public class Demo01 { public static void main(String[] args) { //八大数据类型 int num1 = 10; byte num2 = 20; short num3 = 30; long num4 ...
分类:其他好文   时间:2021-02-22 11:54:36    阅读次数:0
*-汉语-词汇-开发:技术架构
ylbtech-*-汉语-词汇-开发:技术架构 技术架构,technical architecture,大数据新词。 2020年7月,大数据战略重点实验室全国科学技术名词审定委员会研究基地收集审定的第一批108条大数据新词,报全国科学技术名词审定委员会批准,准予向社会发布试用。 1.返回顶部 2.返 ...
分类:其他好文   时间:2021-02-20 11:59:28    阅读次数:0
大数据集群中各个服务的启动与关闭
tomcat 启动tomcat cd /usr/tomcat/apache-tomcat-7.0.57/bin/ ./startup.sh 停止tomcat ./shutdown.sh 查看tomcat日志信息 tail -200f /usr/tomcat/apache-tomcat-7.0.57/ ...
分类:其他好文   时间:2021-02-20 11:58:57    阅读次数:0
实时检索之HBase
1、概念 HBase是一个分布式的NoSQL数据库,其特点高可靠、高性能、面向列、可伸缩。 适合存储大表数据 ,并且可实时读写大表数据。大表:表的规模可以达到数十亿行以及数百万列 表结构稀疏。稀疏:对于为空的列,并不占用存储空间 数据底层存储于Hadoop HDFS分布式文件系统。 利用ZooKee ...
分类:其他好文   时间:2021-02-19 13:36:07    阅读次数:0
分享一些Hadoop的学习资源
Hadoop Beginner's Guide.pdf item description 封面 初版时间 2014-01-01 出版社 人民邮电出版社 作者 Garry Turkington 页数 310 Hadoop技术内幕:深入解析MapReduce架构设计与实现原理.pdf item desc ...
分类:其他好文   时间:2021-02-19 13:06:46    阅读次数:0
一篇文章了解Hbase和Hive
##Hbase和Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。HBase是Hadoop的数据库,一个分布式、可扩展、大数据的存储。单个的从字面意思上或许很难看出二者的 ...
分类:其他好文   时间:2021-02-19 12:52:56    阅读次数:0
警用装备管理系统实现“智能化”
科技迅速开展的当下,越来越多的常见现象完成了智能化办理。例如,日子中的取快递服务,曾经都是由快递员扫码发送短信,告诉收件人收取包裹,有时收件人无法及时赶到快递点,快递点简单积压快递,收件人的快递甚至有或许会被当成无效包裹整理。而现在,随着技能的开展,研发了智能化收取包裹的快递柜,选用一物一码,快递员... ...
分类:其他好文   时间:2021-02-18 13:58:00    阅读次数:0
初识Java
初识Java Java帝国的诞生 J2SE× J2ME× J2EE√ >服务器 Maven Tomcat Spring intellij idea Hadoop Android Java的特性和优势 简单 面向对象 可移植 高性能 分布式 动态性 多线程 安全性 Java为什么成功? 准备+机遇 J ...
分类:编程语言   时间:2021-02-16 12:44:30    阅读次数:0
Spark07-SparkSQL
在介绍 Spark SQL之前,我们先了解两种基本的数据分析方式。 一、数据分析的两种方式 数据分析的方式大致上可以划分为 SQL 和 命令式两种。 命令式 在前面的 RDD部分,非常明显可以感觉的到是命令式的,主要特征是通过一个算子,可以得到一个结果,通过结果再进行后续计算。例如: sc.para ...
分类:数据库   时间:2021-02-16 12:29:50    阅读次数:0
29965条   上一页 1 ... 23 24 25 26 27 ... 2997 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!