搜索关键字：大数据 hadoop apark flume kafka，搜索到29364个结果！码迷,mamicode.com！

Hadoop3 No FileSystem for scheme "hdfs"

Hadoop3 No FileSystem for scheme "hdfs" 异常信息： org.apache.hadoop.fs.UnsupportedFileSystemException: No FileSystem for scheme "hdfs" at org.apache.hadoo ...

分类：其他好文时间：2020-12-31 11:55:00 阅读次数：0

网站用户行为分析

操作过程 2.1 数据准备 A.1sudo mkdir usr/local/bigdatacase A.2sudo chown -R hadoop:hadoop ./bigdatacase A.3mkdir usr/local/bigdatacase/dataset A.4 A.5 B.1sed - ...

分类：Web程序时间：2020-12-30 11:30:32 阅读次数：0

hdfs配置

二 HDFS部署主要步骤如下：1．配置Hadoop的安装环境；2．配置Hadoop的配置文件；3．启动HDFS服务；4．验证HDFS服务可用。1‘ 查看是否存在hadoop安装目录 ls /usr/cstor/hadoop 如果没有，利用工具从本地导入hadoop安装文件。查看jdk是否 ...

分类：其他好文时间：2020-12-30 11:10:24 阅读次数：0

kudu计算公式

kudu计算公式：假设:tabletserver32台master5台最大数据存储量为，复制和压缩后，每个tabletserver9.6TB。每个tabletserver管理的tablet为3000，包含tablet的副本。基于以上限制，可以推测出一下内容：分区=每行大小*总条数<=3.2Gtablet（限制每一台tablet-server1500个分区）,目前现在总kudu表为1546张表

分类：其他好文时间：2020-12-30 10:41:55 阅读次数：0

配置hiveserver2

需要准备 hadoop-2.6.0-cdh5.7.0 、jdk1.8.0_161 、zookeeper-3.4.5-cdh5.7.0、 hive-1.1.0-cdh5.7.0 1.在hadoop 的etc/hadoop/目录中的文件 core-site.xml 添加下面代码，其中颜色标记部分为你的 ...

分类：其他好文时间：2020-12-29 11:30:43 阅读次数：0

Flume的安装配置

flume的概述 Apache Flume是一个分布式，可靠且可用的系统，用于有效地从许多不同的source收集，聚合和移动大量日志数据到集中式数据存储。 Apache Flume的使用不仅限于日志数据聚合。由于数据source是可定制的，因此Flume可用于传输大量event 数据，包括但不限于网 ...

分类：Web程序时间：2020-12-29 11:10:09 阅读次数：0

hadoop介绍-架构

hadoop1.X架构架构模型分布式文件系统核心模块: namenode:集群中的主节点,管理元数据(文件的大小,文件的位置,文件的权限)。 secondaryNameNode:辅助namenode管理元数据信息。 dadanode:集群当中的从节点,主要存储集群中的各种数据。分布式数据计算核 ...

分类：其他好文时间：2020-12-28 11:29:22 阅读次数：0

RabbitMQ、RocketMQ、Kafka等任何队列列不不保证消息不不重复，如果业务需要消息不不重复消费，则需要消费端处理理业务消息要保持幂等性

方式?：Redis的setNX() , 做消息id去重 java版本?目前不不?支持设置过期时间//Redis中操作，判断是否已经操作过 TODOboolean flag = jedis.setNX(key);if(flag){//消费}else{//忽略略，重复消费}方式?：redis的 Incr ...

分类：其他好文时间：2020-12-28 10:58:18 阅读次数：0

Hive中的UDF详解

hive作为一个sql查询引擎，自带了一些基本的函数，比如count(计数)，sum(求和)，有时候这些基本函数满足不了我们的需求，这时候就要写hive hdf(user defined funation)，又叫用户自定义函数。 UDF 创建与使用步骤继承org.apache.hadoop.hiv ...

分类：其他好文时间：2020-12-25 13:07:42 阅读次数：0

MySql大数据量查询limit与order by配合缓慢

大数据量在MySQL中查询分页排序，数据量就会很大我们可以把limit与order by拆分为两个步骤先根据条件把limit、ordey by相关的数据的索引查出来，然后再根据索引查询具体的字段信息（也就是两层嵌套）例： select id, user_name, id, user_name ...

分类：数据库时间：2020-12-25 13:04:20 阅读次数：0

共29364条上一页 1 ... 29 30 31 32 33 ... 2937 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)