搜索关键字：spark bigdata，搜索到7284个结果！码迷,mamicode.com！

Winform中通过NPOI导出Excel的三种方式(HSSFWorkbook，XSSFWorkbook，SXSSFWorkbook)附代码下载

场景 HSSFworkbook,XSSFworkbook,SXSSFworkbook区别 HSSFWorkbook: 是操作Excel2003以前（包括2003）的版本，扩展名是.xls；导出excel最常用的方式；但是此种方式的局限就是导出的行数至多为65535行，超出65536条后系统就会报错。 ...

分类：Windows程序时间：2020-05-29 13:39:57 阅读次数：107

Spark RDD编程双Value类型交互

所谓双Value，就是两个数据集RDD之间进行操作。 1 union(otherDataset)：对源RDD和参数RDD合并后返回一个新的RDD，不会去重 val listRDD1: RDD[Int] = sc.makeRDD(1 to 5) val listRDD2: RDD[Int] = sc. ...

分类：其他好文时间：2020-05-28 23:28:27 阅读次数：71

spark安装

地址官网地址: http://spark.apache.org/ 文档查看地址: https://spark.apache.org/docs/2.1.1/ 下载地址: https://spark.apache.org/downloads.html 集群规划首先我们要确认我们的Linux主机是否安 ...

分类：其他好文时间：2020-05-28 23:25:13 阅读次数：70

WW大数据平台架构

###1.大数据架构说明： 1.该大数据平台采用的阿里云服务器，所以在集群部署和运维上会减少很多工作量 2.主题的计算引擎采用Spark，部分有Flink 3.数据挖掘主要是应用python的一些挖掘框架，模型比如词袋模型和一些常见的nlp算法 4.任务调度是自研的诸葛大数据调度平台 ...

分类：其他好文时间：2020-05-28 11:34:57 阅读次数：68

Kubernetes之ServiceAccount+Secret相关概念

https://blog.csdn.net/BigData_Mining/article/details/88529157 API Server作为Kubernetes网关，是访问和管理资源对象的唯一入口，其各种集群组件访问资源都需要经过网关才能进行正常访问和管理。每一次的访问请求都需要进行合法性的 ...

分类：Web程序时间：2020-05-27 20:33:51 阅读次数：98

Spark原始码系列（五）分布式缓存

问题导读：spark缓存是如何实现的？BlockManager与BlockManagerMaster的关系是什么？这个persist方法是在RDD里面的，所以我们直接打开RDD这个类。 defpersist（newLevel：StorageLevel）：this.type = { // Stora ...

分类：其他好文时间：2020-05-27 15:59:00 阅读次数：71

备份本地库到远端Ucloud云存储

分类：其他好文时间：2020-05-27 15:34:31 阅读次数：59

大数据之Spark单词统计

题目三：使用Spark Core 统计文件中以spark开头的单词中，每个单词出现的次数（共计30分） spark-core hadoop linux java spark-sql storm html css vue spark spring springboot struts spark-hiv ...

分类：其他好文时间：2020-05-26 22:06:21 阅读次数：102

Spark：shuffle原理

shuffle 和 stage shuffle 是划分 DAG 中 stage 的标识,同时影响 Spark 执行速度的关键步骤. RDD 的 Transformation 函数中,又分为窄依赖(narrow dependency)和宽依赖(wide dependency)的操作.窄依赖跟宽依赖的区 ...

分类：其他好文时间：2020-05-26 18:22:19 阅读次数：71

Flink核心概念

分布式缓存分布式缓存的思想在hadoop和spark中都有体现，Flink 提供的分布式缓存类似 Hadoop，目的是为了在分布式环境中让每一个 TaskManager 节点保存一份相同的数据或者文件，当前计算节点的 task 就像读取本地文件一样拉取这些配置。比如在进行表与表 Join 操作时 ...

分类：其他好文时间：2020-05-25 19:29:56 阅读次数：60

共7284条上一页 1 ... 31 32 33 34 35 ... 729 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)