码迷,mamicode.com
首页 >  
搜索关键字:spark streaming kafka    ( 11499个结果
KAFKA测试
kafka功能简单测试 启动zookeeper 启动zk命令: ./zhServer.sh start 启动akfka(注意server.properties的配置) 启动akfka命令:./kafka-server-start.sh /home/hadoop/app/kafka_2.11-0.9. ...
分类:其他好文   时间:2021-04-24 13:16:11    阅读次数:0
07 Spark RDD编程 综合实例 英文词频统计
1. 用Pyspark自主实现词频统计过程。 >>> s = txt.lower().split()>>> dd = {}>>> for word in s:... if word not in dd:... dd[word] = 1... else:... dd[word] = dic[word] ...
分类:其他好文   时间:2021-04-23 12:19:08    阅读次数:0
07 Spark RDD编程 综合实例 英文词频统计
>>> s = txt.lower().split()>>> dd = {}>>> for word in s:... if word not in dd:... dd[word] = 1... else:... dd[word] = dic[word] + 1...>>> ss = sorted( ...
分类:其他好文   时间:2021-04-23 12:18:32    阅读次数:0
07 Spark RDD编程 综合实例 英文词频统计
1. 用Pyspark自主实现词频统计过程。 >>> s = txt.lower().split()>>> dd = {}>>> for word in s:... if word not in dd:... dd[word] = 1... else:... dd[word] = dic[word] ...
分类:其他好文   时间:2021-04-23 12:10:50    阅读次数:0
kafak配置说明
spring: kafka: bootstrap-servers: 112.126.74.249:9092,112.126.74.249:9093 ###########【初始化生产者配置】########### producer: # 应答级别:多少个分区副本备份完成时向生产者发送ack确认(可选 ...
分类:其他好文   时间:2021-04-21 12:08:09    阅读次数:0
Spark OneHot编码原理
python - How to interpret results of Spark OneHotEncoder - Stack Overflow ...
分类:其他好文   时间:2021-04-20 15:16:33    阅读次数:0
05 RDD编程
一、词频统计: 读文本文件生成RDD lines lines=sc.textFile("file:///usr/local/spark/mycode/rdd/word.txt") lines.foreach(print) 将一行一行的文本分割成单词 words flatmap() words=lin ...
分类:其他好文   时间:2021-04-20 14:04:55    阅读次数:0
Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources
解决问题-》有的放矢 1.spark 报错 Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient reso ...
分类:其他好文   时间:2021-04-19 15:56:23    阅读次数:0
消息队列有哪些以及比较
市场上常见的消息队列有如下: ActiveMQ:基于JMS ZeroMQ:基于C语言开发 RabbitMQ:基于AMQP协议,erlang语言开发,稳定性好 RocketMQ:基于JMS,阿里巴巴产品 Kafka:类似MQ的产品;分布式消息系统,高吞吐量 用rabbitmq比较多 ...
分类:其他好文   时间:2021-04-19 15:27:26    阅读次数:0
kafka实战
1. kafka介绍 1.1. 主要功能 根据官网的介绍,ApacheKafka®是一个分布式流媒体平台,它主要有3种功能: 1:It lets you publish and subscribe to streams of records.发布和订阅消息流,这个功能类似于消息队列,这也是kafka ...
分类:其他好文   时间:2021-04-19 14:59:09    阅读次数:0
11499条   上一页 1 ... 11 12 13 14 15 ... 1150 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!