码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
学习大数据:Scala
学习大数据:Scala
分类:其他好文   时间:2020-09-17 18:00:46    阅读次数:18
Linux操作系统的主要应用领域有哪些?
在我们的生活中,除了常见的Windows桌面系统之外,其实还有很多种操作系统,比如说Linux,一个免费开源的操作系统,在大家应用都有着非常不错的表现,那么Linux操作系统的主要应用领域有哪些?我们来看看吧。
分类:系统相关   时间:2020-09-17 17:53:42    阅读次数:40
银河麒麟高级服务器操作系统V10
银河麒麟高级服务器操作系统V10是针对企业级关键业务,适应虚拟化、云计算、大数据、工业互联网时代对主机系统可靠性、安全性、性能、扩展性和实时性的需求,依据CMMI5级标准研制的提供内生安全、云原生支持、国产平台深入优化、高性能、易管理的新一代自主服务器操作系统;同源支持飞腾、龙芯、申威、兆芯、海光、鲲鹏等自主CPU及x86平台;可支撑构建大型数据中心服务器高可用集群、负载均衡集群、分布式集群文件系
分类:其他好文   时间:2020-09-17 17:44:33    阅读次数:179
Spark ML之高级数据源
一.图像数据源 图像数据源用于从目录加载图像文件,它可以通过ImageIO Java库将压缩图像(jpeg,png等)加载为原始图像表示形式。加载的DataFrame具有一StructType列:“ image”,其中包含存储为图像架构的图像数据。该image列的架构为: origin :(Stri ...
分类:其他好文   时间:2020-09-17 17:38:02    阅读次数:52
如何保障大数据环境下的数据安全
大数据正在为安全分析提供新的可能性,对海量数据的分析有助于更好地跟踪网络异常行为,对实时安全和应用数据结合在一起的数据进行预防性分析,可防止诈骗和******。网络***行为总会留下蛛丝马迹,这些痕迹都以数据的形式隐藏在大数据中,从大数据的存储、应用和管理等方面层层把关,可以有针对性地应对数据安全威胁。如何保障大数据环境下的数据安全,成为世界各国共同关注和研究的问题,为此,提出以下几点建议:  1、
分类:其他好文   时间:2020-09-17 17:27:03    阅读次数:42
大数据kafka理论实操面试题
文章来源:https://zhuanlan.zhihu.com/p/121597412 本文仅供学术交流,如有侵权,请留言联系小编进行删除。 1、 请说明什么是Apache Kafka? Apache Kafka是由Apache开发的一种发布订阅消息系统,它是一个分布式的、分区的和重复的日志服务。 ...
分类:其他好文   时间:2020-09-17 17:15:09    阅读次数:32
CentOS 7 下 Cloudera 6.3.1 安装 Hadoop 集群
一、软件介绍1、CDH概览CDH(ClouderaDistributionofApacheHadoop)是ApacheHadoop和相关项目中最完整、经过测试和流行的发行版。CDH提供Hadoop的核心元素,可伸缩存储和可扩展分布式计算,以及基于web的用户界面和关键的企业功能。CDH是apache授权的开放源码,是惟一提供统一批处理、交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解
分类:其他好文   时间:2020-09-17 16:53:39    阅读次数:33
使用Hive SQL窗口函数进行商务数据分析
本文会从一个商务分析案例入手,说明SQL窗口函数的使用方式。通过本文的5个需求分析,可以看出SQL窗口函数的功能十分强大,不仅能够使我们编写的SQL逻辑更加清晰,而且在某种程度上可以简化需求开发。数据准备本文主要分析只涉及一张订单表orders,操作过程在Hive中完成,具体数据如下:--建表CREATETABLEorders(order_idint,customer_idstring,citys
分类:数据库   时间:2020-09-17 16:33:50    阅读次数:45
运营商大数据获取网站访客
要想得到精准顾客线索的难题具体表现为2个层面一是总体目标群体不足精准;二是忽略用户画像。因而,精准获客成功与失败的前提条件是,是不是有充足精准的“用户画像”来做支撑点。所以企业只要处理精准获客这两个痛点,便能迅速获得精准用户。公众号:大海啊好多水运营商大数据提取客源有哪些优势?第一,通过网页页面、网址、手机app用户”运营商大数据都能提取、运营商大数据精准数据具备稳定强化的时效性。用户的消费者行为
分类:Web程序   时间:2020-09-17 16:02:58    阅读次数:46
三、大数据组件之Yarn
YARN YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分 ...
分类:其他好文   时间:2020-09-17 14:19:46    阅读次数:28
29965条   上一页 1 ... 57 58 59 60 61 ... 2997 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!