码迷,mamicode.com
首页 >  
搜索关键字:hadoop 2.7.2 大数据 hdfs ha    ( 28781个结果
Flink 从 0 到 1 学习之(15)Flink读取kafka数据并写入HDFS
1.概述 最近有同学留言咨询,Flink消费Kafka的一些问题,今天笔者将用一个小案例来为大家介绍如何将Kafka中的数据,通过Flink任务来消费并存储到HDFS上。 2.内容 这里举个消费Kafka的数据的场景。比如,电商平台、游戏平台产生的用户数据,入库到Kafka中的Topic进行存储,然 ...
分类:其他好文   时间:2020-09-17 17:38:24    阅读次数:37
如何保障大数据环境下的数据安全
大数据正在为安全分析提供新的可能性,对海量数据的分析有助于更好地跟踪网络异常行为,对实时安全和应用数据结合在一起的数据进行预防性分析,可防止诈骗和******。网络***行为总会留下蛛丝马迹,这些痕迹都以数据的形式隐藏在大数据中,从大数据的存储、应用和管理等方面层层把关,可以有针对性地应对数据安全威胁。如何保障大数据环境下的数据安全,成为世界各国共同关注和研究的问题,为此,提出以下几点建议:  1、
分类:其他好文   时间:2020-09-17 17:27:03    阅读次数:42
大数据kafka理论实操面试题
文章来源:https://zhuanlan.zhihu.com/p/121597412 本文仅供学术交流,如有侵权,请留言联系小编进行删除。 1、 请说明什么是Apache Kafka? Apache Kafka是由Apache开发的一种发布订阅消息系统,它是一个分布式的、分区的和重复的日志服务。 ...
分类:其他好文   时间:2020-09-17 17:15:09    阅读次数:32
CentOS 7 下 Cloudera 6.3.1 安装 Hadoop 集群
一、软件介绍1、CDH概览CDH(ClouderaDistributionofApacheHadoop)是ApacheHadoop和相关项目中最完整、经过测试和流行的发行版。CDH提供Hadoop的核心元素,可伸缩存储和可扩展分布式计算,以及基于web的用户界面和关键的企业功能。CDH是apache授权的开放源码,是惟一提供统一批处理、交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解
分类:其他好文   时间:2020-09-17 16:53:39    阅读次数:33
使用Hive SQL窗口函数进行商务数据分析
本文会从一个商务分析案例入手,说明SQL窗口函数的使用方式。通过本文的5个需求分析,可以看出SQL窗口函数的功能十分强大,不仅能够使我们编写的SQL逻辑更加清晰,而且在某种程度上可以简化需求开发。数据准备本文主要分析只涉及一张订单表orders,操作过程在Hive中完成,具体数据如下:--建表CREATETABLEorders(order_idint,customer_idstring,citys
分类:数据库   时间:2020-09-17 16:33:50    阅读次数:45
运营商大数据获取网站访客
要想得到精准顾客线索的难题具体表现为2个层面一是总体目标群体不足精准;二是忽略用户画像。因而,精准获客成功与失败的前提条件是,是不是有充足精准的“用户画像”来做支撑点。所以企业只要处理精准获客这两个痛点,便能迅速获得精准用户。公众号:大海啊好多水运营商大数据提取客源有哪些优势?第一,通过网页页面、网址、手机app用户”运营商大数据都能提取、运营商大数据精准数据具备稳定强化的时效性。用户的消费者行为
分类:Web程序   时间:2020-09-17 16:02:58    阅读次数:46
三、大数据组件之Yarn
YARN YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分 ...
分类:其他好文   时间:2020-09-17 14:19:46    阅读次数:28
Canalv1.1.4版本搭建HA集群
前提 Canal上一个正式版是于2019-9-2发布的v1.1.4,笔者几个月前把这个版本的Canal推上了生产环境,部署了HA集群。过程中虽然遇到不少的坑,但是在不出问题的前提下,Canal的作用还是非常明显的。上周的一次改造上线之后,去掉了原来对业务系统订单数据通过RabbitMQ实时推送的依赖 ...
分类:其他好文   时间:2020-09-17 14:03:53    阅读次数:64
HDFS-硬盘文件分布式公链骤然崛起你知道吗?
HDFS-硬盘文件分布式公链骤然崛起你知道吗?随着数字内容的增长,数据指数不断的增长。面对海量的数据,传统的存储缺点也越来越明显,如扩展性差、单点故障等。为了克服上述缺点,满足海量数据的存储需求,市场上出现了分布式存储技术。分布式存储的兴起与互联网的发展密不可分,互联网公司由于其数据量大而资本积累少,而通常都使用大规模分布式存储系统。现阶段互联网技术以及硬件的发展,分布式系统的出现、演变一直未曾止
分类:其他好文   时间:2020-09-17 13:56:22    阅读次数:24
HDFS-硬盘文件分布式公链骤然崛起你知道吗?
HDFS-硬盘文件分布式公链骤然崛起你知道吗?随着数字内容的增长,数据指数不断的增长。面对海量的数据,传统的存储缺点也越来越明显,如扩展性差、单点故障等。为了克服上述缺点,满足海量数据的存储需求,市场上出现了分布式存储技术。分布式存储的兴起与互联网的发展密不可分,互联网公司由于其数据量大而资本积累少,而通常都使用大规模分布式存储系统。现阶段互联网技术以及硬件的发展,分布式系统的出现、演变一直未曾止
分类:其他好文   时间:2020-09-17 13:56:08    阅读次数:27
28781条   上一页 1 ... 51 52 53 54 55 ... 2879 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!