码迷,mamicode.com
首页 >  
搜索关键字:scala bigdata 大數據 spark    ( 10680个结果
Spark 获取单独分区的数据
1.上代码 我是1-10分为3个分区 , 并取出下标号为0 的分区的数据 , 并打印 ,要想获得自己想要的分区 , 执行 这里返回的是新 RDD , 并且支持 map等操作 , 但是你只能操作一个分区了 . 在某些内存不够用的情况下 , 可以采用这种分阶段操作的方法. .mapPartitionsW ...
分类:其他好文   时间:2020-05-22 21:16:34    阅读次数:92
Spark 安装
架构 Driver Program:每个 Spark 应用的主程序 Spark Context:在 Driver 里面构建,用于协调、调度在各个节点运行的进程 Cluster Manager:管理节点,分配资源(可以是 Spark standalone、Mesos、Yarn、K8S) Worker ...
分类:其他好文   时间:2020-05-22 09:37:29    阅读次数:62
java.lang.IllegalArgumentException: Required executor memory (1024), overhead (384 MB), and PySpark
ERROR spark.SparkContext: Error initializing SparkContext. java.lang.IllegalArgumentException: Required executor memory (1024), overhead (384 MB), and ...
分类:编程语言   时间:2020-05-21 21:20:50    阅读次数:191
Spark Sql之Catalog
基于版本:Spark 2.2.0 把一些概念搞清楚,Spark轮廓就清晰了。 什么是Catalog,中文翻译目录,那啥叫目录呢?下面是百度百科的解释: `目录,是指书籍正文前所载的目次,是揭示和报道图书的工具。目录是记录图书的书名、著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆藏、指导阅读 ...
分类:数据库   时间:2020-05-21 19:20:07    阅读次数:95
大数据命题方向
2 命题方向 每团队3-5人,请使用目前流行的大数据框架与分析挖掘工具,如:Hadoop、Spark、R、Flink、TensorFlow语言等,完成一个实用的软件系统,为行业、企业或个人生活提供有益的支持。选题方向可结合(但不限于)以下方面: (1)互联网数据或者传统信息管理系统数据的获取与分析: ...
分类:其他好文   时间:2020-05-21 19:02:38    阅读次数:65
OpenCV Mat的总结
一.数字图像的储存 数字图像存储时,我们存储的是图像中像素点的数值,对应的是一个数字矩阵。 2.Mat的储存 1.OPENCV1基于C接口定义的图像存储格式Ipllmage*,直接暴露内存,如果忘记释放内存,就会造成 内存泄漏。 二.从OPENCV2开始,使用Mat类储存图像,具有以下优势: (1) ...
分类:其他好文   时间:2020-05-21 19:00:10    阅读次数:56
一起学scala--数组相关操作
你将学到如何在scala中操作数组,还将会学到数组的一些常用函数。 ...
分类:编程语言   时间:2020-05-21 14:48:12    阅读次数:41
scala中:_*的使用
1.计算1到4的和 1 def main(args: Array[String]): Unit = { 2 3 val total = sum(1,2,3,4) 4 println(total) 5 6 } 7 8 def sum(args: Int*) = { 9 var result = 0 1 ...
分类:其他好文   时间:2020-05-21 10:17:21    阅读次数:130
重启虚拟机后,Hive无法启动,如何解决?
报错: Exception in thread "main" java.lang.RuntimeException: java.net.SocketException: Call From bigdata/192.168.0.108 to bigdata:9000 failed on socket ...
分类:其他好文   时间:2020-05-20 18:38:55    阅读次数:98
.net core kafka 入门实例 一篇看懂
kafka 相信都有听说过,不管有没有用过,在江湖上可以说是大名鼎鼎,就像天龙八部里的乔峰。国际惯例,先介绍生平事迹 简介 Kafka 是由 Apache软件基金会 开发的一个开源流处理平台,由 Scala 和 Java 编写。Kafka是一种高吞吐量的 分布式 ,支持分区(partition),多 ...
分类:Web程序   时间:2020-05-20 12:19:58    阅读次数:73
10680条   上一页 1 ... 47 48 49 50 51 ... 1068 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!