码迷,mamicode.com
首页 > 其他好文 > 详细

hadoop和maven

时间:2020-11-16 13:51:20      阅读:9      评论:0      收藏:0      [点我收藏+]

标签:介绍   sudo命令   mave   version   账号密码   结构   权限   密度   var   

1、大数据有哪些特点?
valume(大量)
velocity(高速)
variety(多样)
value(低价值密度)
2、什么是大数据?
指无法在一定的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
3、大数据是用来解决什么的?
主要解决,海量数据的存储和海量数据的分析计算问题。
4、What is Hadoop?
分布式系统基础架构
5、Hadoop有哪些优势?
高可靠性:hadoop底层维护多个数据副本,即使hadoop某个计算元素或 存储出现故障,也不会导致数据的丢失
高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点
高效性 :在MapReduce的思想下,Hadoop是并行工作的,以加快任务处 理速度
6、sudo命令用处?
可为Hadoop用户增加管理员权限,方便不熟,避免比较棘手的权限问题
7、使用sudo时有几点需要注意的?
用户在执行sudo命令时要求输入账号密码,如果验证失败,sudo命令将会退出
8、Hadoop 2个组件-HDFS\YARN,1个思想(框架)MapReduce,它们的组成架构。
HDFS: NameNode(nn)存储文件的元数据
DataNode(dn)在本地系统存储文件块数据
Secondary NameNode(2nn) 每隔一段时间对NameNode元 数据备份
YARN :ResourceManager
Nodemanager
ApplicationMaster
Container
MapReduce: MapReduce将计算过程分为两个阶段,Map和Reduce
map阶段并行处理输入数据
Reduce阶段对Map结果进行汇总

9、中大型企业,大数据部门都由什么组成?
大数据部门组织结构:平台组,数据仓库组,实时组,数据挖掘组,报表开 发组
10、pom是什么意思?
Project Object Model,项目对象模型。
11、依靠什么可以在Maven仓库中确定一个唯一的Maven工程?
依靠Maven坐标,其表示为groupid+artifactid+version
12、请介绍Maven中坐标概念
[1]groupId:公司或组织的域名倒序+当前项目名称 [2]artifactId:
当前项目的模块名称 [3]version:当前模块的版本
13、请简单介绍使用Maven的原因
添加第三方jar包、jar包之间的依赖关系、获取第三方jar包
14、Maven可以对Java程序进行自动化构建的原因是
约定>配置>编码。意思就是能用配置解决的问题就不编码,
能基于约定的就不进行配置。
而Maven正是因为指定了特定文件保存的目录才能够对我们的Java工程进行自动化构建。

hadoop和maven

标签:介绍   sudo命令   mave   version   账号密码   结构   权限   密度   var   

原文地址:https://www.cnblogs.com/BreakLiu/p/13955965.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!