码迷,mamicode.com
首页 >  
搜索关键字:spark streaming flume 整合 avro netcat    ( 21554个结果
经典教程 | 基于Spark GraphX实现微博二度关系推荐
经典教程|基于SparkGraphX实现微博二度关系推荐导读:图计算是近几年大数据领域非常受关注的热点,社交网络中的好友关系推荐是一种典型图计算场景,本文是微博关系项目团队在二度关系计算中的一些实践,供高可用架构读者参考,作者为王舜、蒋生武、田瑞林。关系计算问题描述二度关系是指用户与用户通过关注者为桥梁发现到的关注者之间的关系。目前微博通过二度关系实现了潜在用户的推荐。用户的一度关系包含了关注、好
分类:其他好文   时间:2020-11-07 17:07:30    阅读次数:27
sentinel整合servlet
<dependency> <groupId>com.alibaba.csp</groupId> <artifactId>sentinel-web-servlet</artifactId> <version>1.8.0</version> </dependency> @Bean public Filt ...
分类:其他好文   时间:2020-11-07 17:04:49    阅读次数:25
Hadoop使用实例
1.词频统计 a.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 b.编写map与reduce函数 c.本地测试map和reduce d.将文本数据上传到HDFS上 e.用hadoop streaming提交任务 f.查看运行结果 g.计算结果取回本地 ...
分类:其他好文   时间:2020-11-07 16:36:45    阅读次数:33
Hadoop使用实例
1.下载喜欢的电子书或大量文本数据,并保存在本地文件夹中 2.编写map与reduce函数 3.本地测试map与reduce 4.将文本数据上传至HDFS上 5.用hadoop streaming提交任务 6.查看运行结果 7.计算结果取回到本地 ...
分类:其他好文   时间:2020-11-07 16:32:22    阅读次数:17
Hadoop实例
1.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 2编写map与reduce函数 3本地测试map与reduce 4将文本数据上传至HDFS上 5.用hadoop streaming提交任务 6.查看运行结果 7.计算结果取回到本地 ...
分类:其他好文   时间:2020-11-07 16:17:20    阅读次数:18
机器学习平台痛点与模型提升方法:基于Spark的机器学习平台在点融网风控应用介绍
机器学习平台痛点与模型提升方法:基于Spark的机器学习平台在点融网风控应用介绍编者按:大数据和机器学习是近年来快速增长的热门领域,各个领域的数据量和数据规模都以惊人的速度增长。本文是近期举行的架构实践日点融网刘利就“机器学习平台在点融网业务的应用介绍”这一话题的精彩分享。作者简介:刘利,点融网DataScientistTeam负责人,从事互联网数据分析和数据挖掘近十年。现任点融网DataScie
分类:其他好文   时间:2020-11-07 15:58:21    阅读次数:20
(十四) 整合spring cloud云架构 - Spring Cloud构建分布式电子商务平台
通过SpringCloud构建PC+微信+APP+云服务的云商平台系统,其中包括B2B、B2C、C2C、O2O、新零售、直播电商等子平台,之前我们讲了很多关于SpringCloud的概念文章,从本节开始,我们会以分布式微服务电子商务平台为案例,逐步给大家讲解如何构建完整的电子商务云平台。技术解决方案开发语言:java数据库:mysqlJDK支持版本:JDK1.8核心技术:分布式、云服务、微服务、服
分类:编程语言   时间:2020-11-07 15:57:29    阅读次数:68
从海外进军中国,Rancher要执容器云市场牛耳 | 爱分析调研
调研 | 李喆 张宏祥 撰写 | 魏伯乐 摘要:拥有极强技术能力的Rancher,定位于企业级容器云平台产品供应商,开发了开源企业级Kubernetes管理平台,从而帮助企业快速将容器技术落地。 过去十几年时间里,得益于以AWS为代表的公有云厂商的发展,IT底层资源迅速扩张,无论是计算、存储或是网络 ...
分类:其他好文   时间:2020-11-07 15:49:29    阅读次数:20
Flink从入门到真香(Flink介绍)
关于概念的东西,其实官网说的很全,对于个人理解就是,flink、spark等等大数据处理平台就是把原来需要我们自己实现的功能,全部框架封装好,像是跨机器的大规模计算、内存/cpu等等资源管理、状态管理(锁还有恢复机制等等)框架全部封装好了,作为开发来说就只需要关心自己要实现的业务就可以了以下内容来自官网,从3个方面介绍Flink:架构ApacheFlink是一个框架和分布式处理引擎,用于在无边界和
分类:其他好文   时间:2020-11-06 02:27:17    阅读次数:21
Flink从入门到真香(1-分别使用流模式和批模式运行第一个demo)
基本概念部分,批处理和流处理的区别批处理在大数据世界有着悠久的历史,比较典型的就是spark。批处理主要操作大容量静态数据集,并在计算过程完成后返回结果。批处理模式中使用的数据集通常符合下列特征:(1)有界:批处理数据集代表数据的有限集合(2)持久:数据通常始终存储在某种类型的持久存储位置中(3)大量:批处理操作通常是处理极为海量数据集的唯一方法批处理非常适合需要访问全套记录才能完成的计算工作。例
分类:其他好文   时间:2020-11-06 02:26:18    阅读次数:29
21554条   上一页 1 ... 38 39 40 41 42 ... 2156 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!