码迷,mamicode.com
首页 >  
搜索关键字:大数据 hadoop ccah ccdh 培训    ( 31278个结果
Hive 操作与应用 词频统计
一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop,启动hive 3.创建数据库,创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果 二、hive用HDFS上的文件进行词频统计1.准备电子书或其它大的文本文 ...
分类:其他好文   时间:2020-12-10 11:24:10    阅读次数:6
Hive 操作与应用 词频统计
一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop,启动hive 3.创建数据库,创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果 二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 ...
分类:其他好文   时间:2020-12-10 10:59:18    阅读次数:4
Hive 操作与应用 词频统计
一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop,启动hive 3.创建数据库,创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果 二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 ...
分类:其他好文   时间:2020-12-10 10:55:10    阅读次数:3
HADOOP之HDFS用idea操作(五)
使用idea操作HDFS、创建文件、上传文件、获取块信息、下载文件 1.搭建maven工程 2.pom依赖 <!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-common --> <dependency> <groupI ...
分类:其他好文   时间:2020-12-09 12:24:14    阅读次数:6
Hive 操作与应用 词频统计
一、hive用本地文件进行词频统计 1.准备本地txt文件 mkdir wc cd wc echo "hadoop hbase" > f1.txt echo "hadoop hive" > f2.txt 2.启动hadoop,启动hive start-all.sh hive 3.创建数据库,创建文本 ...
分类:其他好文   时间:2020-12-09 12:15:14    阅读次数:5
基于云原生的大数据实时分析方案实践
1方案介绍大数据处理技术现今已广泛应用于各个行业,为业务解决海量存储和海量分析的需求。但数据量的爆发式增长,对数据处理能力提出了更大的挑战,同时对时效性也提出了更高的要求。实时分析已成为企业大数据分析中最关键的术语,这意味企业可将所有数据用于大数据实时分析,实现在数据接受同时即刻为企业生成分析报告,从而在第一时间作出市场判断与决策。典型的场景如电商大促和金融风控等,基于延迟数据的分析结果已经失去了
分类:其他好文   时间:2020-12-07 12:19:18    阅读次数:6
不需建模型,轻松处理数据的透视分析
?进行数据分析的时候,我们会根据分析的数据内容选择合适的图表来进行数据可视化分析和展示,对较大数据进行汇总分析时,我们常常会用到数据透视表,但是,excel里做数据透视表很复杂,总是记不了步骤,也经常点错,每次使用都得重头做一遍。是否有什么软件可以拖拖拽拽,快速制作数据透视表?有!就是Smartbi ...
分类:其他好文   时间:2020-12-07 12:00:40    阅读次数:4
部署单机版的hadoop+hive小记
前言 在本机模拟器的ubuntu18版本上进行的部署测试,参考的官方文档: hadoop: 链接地址 hive: 链接地址 使用的版本: hadoop: 3.2.1 hive: 3.1.2 全程是使用root账号进行的配置。 hadoop安装配置 hadoop使用的是虚拟集群,即单机模拟集群,dat ...
分类:其他好文   时间:2020-12-05 10:52:38    阅读次数:7
按位使用数据以及union
按位使用数据以及union 例如:typedef union tagData{ long x:2; long y:4; long data;}data_item,*pdata_item; 上述是一个联合体,联合体的对象用的空间是类型中占用内存最大的哪个,例如上例中data_item变量占用4个字节。 ...
分类:其他好文   时间:2020-12-04 11:18:07    阅读次数:7
Hive的基本介绍
什么是Hive? Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将SQL转化成MapReduce程序。 1、Hive 处理的数据存储在HDFS; 2、Hiv ...
分类:其他好文   时间:2020-12-03 11:43:46    阅读次数:3
31278条   上一页 1 ... 24 25 26 27 28 ... 3128 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!