码迷,mamicode.com
首页 >  
搜索关键字:flume spark sparkflumeprotocol    ( 7976个结果
大数据 消息 日志
scribe_百度百科 https://baike.baidu.com/item/scribe flume(日志收集系统)_百度百科 https://baike.baidu.com/item/flume/6250098 Kafka(科技术语)_百度百科 https://baike.baidu.com ...
分类:其他好文   时间:2020-06-16 20:48:33    阅读次数:58
scala 如何显示 大数
1.在使用Spark的 sum() 算子经常遇到结果被自动转化为科学技术 如何正常显示呢 假如 n结果会是一个科学计数法 val n=data.map(x=>x.toInt).sum() 然后我们 val a = BigDecimal(n) println(a) 这样打印出来的结果就是正常的大数 ...
分类:其他好文   时间:2020-06-16 10:24:45    阅读次数:95
Spark Streaming读取Kafka数据两种方式
1.基于Receiver的方式 这种方式使用Receiver来接收kafka中的数据,Receiver是基于kafka的高层Consumer API来实现的。Receiver从Kafka中获取的数据都是存储在Spark Executor的内存中的,然后Spark Streaming启动的job会去处 ...
分类:其他好文   时间:2020-06-15 22:58:10    阅读次数:60
Spark 双流join代码示例
基本思想 与flink流的join原理不同的是,Spark双流join是对俩个流做满外连接 ,因为网络延迟等关系,不能保证每个窗口中的数据key都能匹配上,这样势必会出现三种情况:(some,some),(None,some),(Some,None),根据这三种情况,下面做一下详细解析: (some ...
分类:其他好文   时间:2020-06-15 21:21:14    阅读次数:156
Spark文档阅读之二:Programming Guides - Quick Start
Spark文档阅读之Programming Guides - Quick Start。学习spark-shell任务提交方法和独立spark任务的创建和提交执行。 ...
分类:其他好文   时间:2020-06-15 20:41:53    阅读次数:51
# spark + TDengine的使用
企业介绍: 中国电信上海理想信息产业(集团)有限公司,成立于1999年,注册资本7000万元,是上海市投资规模较大的信息技术企业之一。母公司员工500多人,其中80%以上员工具有大学本科以上学历,从事软件开发人员超过50%,是一个典型的“知识密集型”企业。 通过整合公司内各事业部多年大型项目实施的整 ...
分类:其他好文   时间:2020-06-15 00:04:45    阅读次数:78
项目总体分析
不同的视频APP可能和不同公司的ADX有股份关系,甚至,有的视频APP做大了,可以用自己的ADX,那从app到ADX的数据可以直接对接,否则就要有合作,然后ADX对接广告投放引擎 广告投放引擎(也就是媒体服务器)对接多个媒体的数据, (从广告投放引擎,怎么将数据Flume到hdfs,这个不清楚) 这 ...
分类:其他好文   时间:2020-06-14 23:24:11    阅读次数:133
Spark Scala 将数据保存到Mysql
1添加pom.xml配置 <build> <sourceDirectory>src/main/scala</sourceDirectory> <testSourceDirectory>src/test/scala</testSourceDirectory> <plugins> <plugin> <g ...
分类:数据库   时间:2020-06-14 18:56:57    阅读次数:138
python中使用pyspark 读取和整理日志数据并将数据写入到es中去
代码: import re import datetime from pyspark.sql import SparkSession from pyspark import SparkContext from elasticsearch import Elasticsearch spark=Spar ...
分类:编程语言   时间:2020-06-14 17:09:05    阅读次数:125
idea打包Spark 找不到主类
1. 用idea的maven项目 package 打包, 去 Linux 执行 spark-submit --class com.Spark_HDFS --master local ./SXC-1.0-SNAPSHOT.jar 遇到 找不到主类 , 这时候需要更加稳定的打包方式 去打包 scala ...
分类:其他好文   时间:2020-06-14 12:57:57    阅读次数:127
7976条   上一页 1 ... 30 31 32 33 34 ... 798 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!