码迷,mamicode.com
首页 >  
搜索关键字:flume spark sparkflumeprotocol    ( 7976个结果
Spark MLlib机器学习概论
一.什么是机器学习? 什么是机器学习?Herbert Sinmon给“学习”做出了这样的定义:“如果一个系统能够通过执行某个过程而改进性能,这就是学习。”更通俗的理解是:机器学习能够自动地从数据中学习“程序”,而这个程序不是人来编写的。 平面上有两类点,黄色代表类别a,蓝色代表类别b。这时我们希望能 ...
分类:其他好文   时间:2020-07-26 15:43:33    阅读次数:56
Flume基础(一):概述
1 Flume 定义 Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume 基于流式架构,灵活简单。 2 Flume 组成架构 Flume 组成架构如图 1-1,图 1-2 所示: 2.1 Agent Agent 是一个 JVM 进程,它 ...
分类:Web程序   时间:2020-07-26 02:04:24    阅读次数:109
Flume基础(二):快速入门
1 Flume 安装地址 1) Flume 官网地址 http://flume.apache.org/ 2)文档查看地址 http://flume.apache.org/FlumeUserGuide.html 3)下载地址 http://archive.apache.org/dist/flume/ ...
分类:Web程序   时间:2020-07-26 02:04:05    阅读次数:121
web worker计算md5实践及遇到的坑
webworker计算md5实践及遇到的坑最近项目要实现大文件的分块上传及断点续传,其中文件的md5是判断文件或文件块是否已被上传的重要依据。1.阶段一编码初期,直接在公共方法中写了一个传入file返回md5的函数,供文件上传模块使用。关键代码如下:/***获取文件的md5*@param{*}file文件对象*/importSparkMD5from‘spark-md5‘exportasyncfun
分类:Web程序   时间:2020-07-24 23:48:21    阅读次数:117
解决jar包冲突导致的NoSuchMethodException或NoSuchFieldError异常
问题背景: 使用spark datasource v2 接口,外接存储源时,发现更改项目版本后,spark-shell报错 搜索该错误无果,网上报什么window util错,并不是我遇到的问题. error: not found: value spark Exception in thread " ...
分类:编程语言   时间:2020-07-24 15:52:06    阅读次数:115
flume从Kafka消费数据到HDFS
#source的名字 agent.sources = kafkaSource # channels的名字,建议按照type来命名 agent.channels = memoryChannel # sink的名字,建议按照目标来命名 agent.sinks = hdfsSink # 指定source使 ...
分类:Web程序   时间:2020-07-23 22:28:11    阅读次数:105
java Spark 读取hbase数据
引用的jar包(maven) <properties> <java.version>1.8</java.version> <ch.qos.logback.version>1.2.3</ch.qos.logback.version> <sharding-sphere.version>4.1.1</sh ...
分类:编程语言   时间:2020-07-21 21:58:23    阅读次数:74
(一)Spark
Spark基础入门 1、spark的核心概念 2、spark的四大特性 3、spark的整体架构 4、spark的集群安装部署 5、spark的集群的启动和停止 6、spark的集群web管理界面 7、spark-shell Driver 它会执行客户端写好的main方法,它会构建一个名叫Spark ...
分类:其他好文   时间:2020-07-21 09:31:03    阅读次数:90
深入理解Spark Streaming
一.DStream的两类操作 DStream内部其实是RDD序列,所有的DStream操作最终都转换为RDD操作。通过分析源码,可以进一步窥探这种转换是如何进行的。 DStream有一些与RDD类似的基础属性: 依赖的其它DStream列表。 生成RDD的时间间隔。 一个名为compute的计算函数 ...
分类:其他好文   时间:2020-07-20 13:13:18    阅读次数:64
运行spark时提示 env: ‘python’: No such file or directory
运行spark时提示如下信息: hadoop@MS-YFYCEFQFDMXS:/home/trp$ cd /usr/local/spark hadoop@MS-YFYCEFQFDMXS:/usr/local/spark$ ./bin/pyspark env: ‘python’: No such fi ...
分类:编程语言   时间:2020-07-19 23:47:58    阅读次数:111
7976条   上一页 1 ... 20 21 22 23 24 ... 798 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!