搜索关键字：spark 大数据 hadoop hive parquet，搜索到33788个结果！码迷,mamicode.com！

06 Spark SQL 及其DataFrame的基本操作

1.Spark SQL出现的原因是什么? Spark SQL的前身是 Shark，Shark最初是美国加州大学伯克利分校的实验室开发的Spark生态系统的组件之一，它运行在Spark系统之上，Shark重用了Hive的工作机制，并直接继承了Hive的各个组件， Shark将SQL语句的转换从Map ...

分类：数据库时间：2021-05-24 04:16:49 阅读次数：0

【C#】Color颜色对照表

【C#】Color颜色对照表,GDI+ 绘图大用处 Color.AliceBlue 240,248,255 Color.LightSalmon 255,160,122 Color.AntiqueWhite 250,235,215 Color.LightSeaGreen 32,178,170 Colo ...

分类：Windows程序时间：2021-05-24 03:58:29 阅读次数：0

06 Spark SQL 及其DataFrame的基本操作

1.Spark SQL出现的原因是什么? 随着Spark的发展，对于野心勃勃的Spark团队来说，Shark对于Hive的太多依赖（如采用Hive的语法解析器、查询优化器等等），制约了Spark的One Stack Rule Them All的既定方针，制约了Spark各个组件的相互集成，所以提出 ...

分类：数据库时间：2021-05-24 03:53:49 阅读次数：0

完美避坑！记一次Elasticsearch集群迁移架构实战

前言 Elastic自身设计了集群分片的负载平衡机制，当有新数据节点加入集群或者离开集群，集群会自动平衡分片的负载分布。需求背景公司原有大数据平台基于公有云构建，由于种种原因，现在需要迁移到自建机房，Elasticsearch集群承担了大数据平台主要的对外查询需求，也有部分实时计算需求基于Ela ...

分类：其他好文时间：2021-05-24 03:46:38 阅读次数：0

在AWS Glue中使用Apache Hudi

1. Glue与Hudi简介 AWS Glue AWS Glue是Amazon Web Services(AWS)云平台推出的一款无服务器(Serverless)的大数据分析服务。对于不了解该产品的读者来说，可以用一句话概括其实质：Glue是一个无服务器的全托管的Spark运行环境，只需提供Spar ...

分类：Web程序时间：2021-05-24 03:46:26 阅读次数：0

Spark SQL 及其DataFrame的基本操作

Spark SQL出现的原因是什么? Spark SQL是Spark用来处理结构化数据的一个模块，它提供了一个叫作Data Frame的编程抽象结构数据模型(即带有Schema信息的RDD),Spark SQL的前身是 Shark，由于 Shark过于依赖Hive，因此在版本迭代时很难添加新的优化 ...

分类：数据库时间：2021-05-24 03:08:56 阅读次数：0

人脸识别数据集

1、yale 人脸数据库(美国,耶鲁大学) 2、剑桥大学的ORL人脸库 3、 ...

分类：其他好文时间：2021-05-24 02:58:14 阅读次数：0

记一次部署Hadoop后遭受kthreaddi挖矿病毒

云服务器在部署Hadoop后便被黑了，查看进程发现了kthreaddi占满了CPU。 ...

分类：其他好文时间：2021-05-24 01:55:01 阅读次数：0

could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datanode(s) running and no node(s) are excluded in this operation.

hdfs dfsadmin -report hadoop fsck -locations ...

分类：其他好文时间：2021-05-24 01:37:15 阅读次数：0

数栈人：从青铜到星耀，10年大数据人的奋战晋级之路

? 今天，大家就请跟着数栈君一起，和申杭聊聊他从青铜到星耀的大数据之路。数栈君：申杭，你是07年从华中科技大学软件工程专业毕业的，能说说你当时为什么选择这个专业吗？申杭：当时会计、师范、机械制造、土木类专业比较热门，一般家人都会让报这些专业，出来好就业。而电子、计算机、软件工程类的专业刚刚兴起， ...

分类：其他好文时间：2021-05-24 00:46:57 阅读次数：0

共33788条上一页 1 ... 15 16 17 18 19 ... 3379 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)