首先创建好项目工程,如下图:完善pom.xml文件,具体为:(依据自己的spark版本做修改)<dependencies><dependency><groupId>org.scala-lang</groupId><artifactId>scala-library</artifactId><version>2.11.
                            
                            
                                分类:
其他好文   时间:
2020-07-14 09:21:08   
                                阅读次数:
78
                             
                    
                        
                            
                            
                                Spark 源码解读(一)SparkContext的初始化之TaskScheduler的启动 TaskScheduler创建完成之后,需要调用start()方法才可以生效,SparkContext的代码如下: _taskScheduler.start() TaskScheduler在启动的时候,实际 ...
                            
                            
                                分类:
其他好文   时间:
2020-07-14 00:25:58   
                                阅读次数:
81
                             
                    
                        
                            
                            
                                    数据算法 Hadoop Spark大数据处理技巧 ...
                            
                            
                                分类:
编程语言   时间:
2020-07-13 18:11:22   
                                阅读次数:
80
                             
                    
                        
                            
                            
                                    tophua/spark-machine-learning-book Spark机器学习书代码 25 Jupyter Notebook Updated on 22 Dec 2017 zengxiaosen/eshop 电商+大数据+spark机器学习 11 Java Updated on 5 Dec ...
                            
                            
                                分类:
其他好文   时间:
2020-07-13 18:02:05   
                                阅读次数:
74
                             
                    
                        
                            
                            
                                    水平有限,本文仅以流水账的方式 介绍自己 安装 三款软件 的过程。 环境Ubuntu on 虚拟机: $ cat /proc/version Linux version 4.15.0-54-generic (buildd@lgw01-amd64-014) (gcc version 7.4.0 \(U ...
                            
                            
                                分类:
其他好文   时间:
2020-07-13 13:14:44   
                                阅读次数:
63
                             
                    
                        
                            
                            
                                    java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. 出现这个问题的原因是我们在windows上模拟开发环境,但并没有真正的搭建hadoop和spark 解决办法: ...
                            
                            
                         
                    
                        
                            
                            
                                    package com.sjw.flink import org.apache.flink.configuration.Configurationimport org.apache.flink.streaming.api.functions.sink.{RichSinkFunction, SinkF ...
                            
                            
                                分类:
其他好文   时间:
2020-07-10 00:43:32   
                                阅读次数:
74
                             
                    
                        
                            
                            
                                    package com.sjw.flink import org.apache.flink.api.common.serialization.SimpleStringSchemaimport org.apache.flink.streaming.api.scala._import org.apach ...
                            
                            
                                分类:
其他好文   时间:
2020-07-10 00:36:15   
                                阅读次数:
78
                             
                    
                        
                            
                            
                                    package com.sjw.flink import org.apache.flink.api.common.state.{ValueState, ValueStateDescriptor}import org.apache.flink.streaming.api.functions.Keyed ...
                            
                            
                                分类:
其他好文   时间:
2020-07-10 00:31:17   
                                阅读次数:
114
                             
                    
                        
                            
                            
                                    package com.sjw.flink import org.apache.flink.streaming.api.TimeCharacteristicimport org.apache.flink.streaming.api.functions.timestamps.BoundedOutOfO ...
                            
                            
                                分类:
其他好文   时间:
2020-07-10 00:16:33   
                                阅读次数:
80