码迷,mamicode.com
首页 >  
搜索关键字:scala bigdata 大數據 spark    ( 10680个结果
Spark SQL的官网解释
一.官网位置1.位置2.解释官网位置DataSet1.6出现的SchemaRDD<1.31.3版本前叫SchemaRDD1.3以后叫DataFrameDataSet支持Scala,JAVA不支持pythonDataFrame支持四种JAVA,Scala.Python,RDataFrame:并不是sparksql独创的,原来就有的,从其他框架借鉴过来的二.DataFrame注意事项1.注意分布
分类:数据库   时间:2020-01-05 09:39:35    阅读次数:76
Spark和Kafka在IDEA整合运行时提示''com.fasterxml.jackson.databind.JsonMappingException: Incompatible Jackson version: 2.9.1''
使用kafka和sparkstreaming整合时,IDEA运行程序报错"com.fasterxml.jackson.databind.JsonMappingException: Incompatible Jackson version: 2.9.1",初步看是版本不兼容,但是版本后面确认没有问题, ...
分类:移动开发   时间:2020-01-05 09:29:41    阅读次数:291
【BigData】Java基础_多线程
所谓的多线程就像小吃街卖铜锅米线的老板,老板就好比一个操作系统,如果5个顾客同时去买米线,那么,此时老板就会同时准备好5个铜锅,然后同时放上水、调料、米线,同时煮5个人的米线,如果逐个煮的话,那么估计煮了2个人的米线,后面3人就来找老板退款了。 官方解释:多线程(英语:multithreading) ...
分类:编程语言   时间:2020-01-04 18:34:49    阅读次数:69
Java容器的常见问题
记录Java容器中的常见概念和原理 参考: https://github.com/wangzhiwubigdata/God Of BigData %E4%B8%89Java%E5%B9%B6%E5%8F%91%E5%AE%B9%E5%99%A8 https://blog.csdn.net/justl ...
分类:编程语言   时间:2020-01-04 18:04:40    阅读次数:70
大数据才是重点,Oracle、SQL Server成昨日黄花?
引子有人在某个专注SQL的公众号留言如下:这个留言触碰到一个非常敏感的问题:搞关系型数据库还有前途吗?现在都2020年了,区块链正火热,AI人才已经“过剩”,大数据都成了稀松平常的萝卜白菜,你却还在搞SQLServer?你还在搞SQL?原因最近10年,数据管理领域的变化可谓精彩纷呈。什么Hadoop,Spark,MemcacheDB,Redis,Vertica,HANA,Cassandra,Mon
分类:数据库   时间:2020-01-04 16:59:14    阅读次数:113
8、Yarn资源调度系统架构与原理分析
本文详细的介绍了Hadoop的Yarn架构与原理分析
分类:其他好文   时间:2020-01-03 19:39:26    阅读次数:84
spark-streaming对接kafka的两种方式
spark-streaming对接kafka有两种方式:1.基于receiver的方式,属于高级API,简单但是效率低,容易丢失数据(可以设置WAL)。它的原理是:receiver从kafka拉取数据存储到executor的内存中,spark-streaming启动job处理数据。偏移量保存在zoo ...
分类:其他好文   时间:2020-01-03 14:07:49    阅读次数:84
flink 源代码编译
1、安装准备:[root@master flink-dist]# mvn --versionApache Maven 3.2.5 [root@master flink-dist]# scala -versionScala code runner version 2.12.6 --[root@mast ...
分类:其他好文   时间:2020-01-01 15:19:20    阅读次数:93
2019-12-30面试反思
面试公司: 一家中小型电商 面试中的问题: 思路不要太跳跃性, 不然容易尬。 引导的时候脑子需要快速运转该说什么。 自己熟的那块一定要准备充分答出百分之80以上。 排序算法, 选一个说: 建议快排, 归并, 面试前手写一下找找感觉。 挖坑桶排: 需要对难点做准备: 按照什么条件分桶? 空间利用率的优 ...
分类:其他好文   时间:2019-12-31 20:08:27    阅读次数:108
2.Spark 2.x 集群部署和测试
配置免密度登录 执行 ssh-keygen -t rsa#建立 ssh 目录,一路敲回车, 生成的密钥对 id_rsa, id_rsa.pub,默认存储在~/.ssh 目录下 现在给slave1节点设置公钥 执行 ssh-keygen -t rsa#建立 ssh 目录,一路敲回车, 生成的密钥对 i ...
分类:其他好文   时间:2019-12-31 19:01:20    阅读次数:105
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!