搜索关键字：hadoop 大数据云计算，搜索到28457个结果！码迷,mamicode.com！

kudu计算公式

kudu计算公式：假设:tabletserver32台master5台最大数据存储量为，复制和压缩后，每个tabletserver9.6TB。每个tabletserver管理的tablet为3000，包含tablet的副本。基于以上限制，可以推测出一下内容：分区=每行大小*总条数<=3.2Gtablet（限制每一台tablet-server1500个分区）,目前现在总kudu表为1546张表

分类：其他好文时间：2020-12-30 10:41:55 阅读次数：0

配置hiveserver2

需要准备 hadoop-2.6.0-cdh5.7.0 、jdk1.8.0_161 、zookeeper-3.4.5-cdh5.7.0、 hive-1.1.0-cdh5.7.0 1.在hadoop 的etc/hadoop/目录中的文件 core-site.xml 添加下面代码，其中颜色标记部分为你的 ...

分类：其他好文时间：2020-12-29 11:30:43 阅读次数：0

2.2 VMware vSphere的优势

对于VMwarevSphere的优势，主要分为以下几个方面。 1、通过提高利用率和实现自动化获得高效率可实现15:1或更高的整合率，将硬件利用率从5%-15%提高到80%甚至更高，而且无需牺牲性能。 2、在整个云计算基础架构范围内最大限度地增加正常运行时间减少计划外停机时间，并消除用于服务器和存储维护的计划内停机时间 3、大幅降低IT成本&nb

分类：系统相关时间：2020-12-28 11:51:18 阅读次数：0

hadoop介绍-架构

hadoop1.X架构架构模型分布式文件系统核心模块: namenode:集群中的主节点,管理元数据(文件的大小,文件的位置,文件的权限)。 secondaryNameNode:辅助namenode管理元数据信息。 dadanode:集群当中的从节点,主要存储集群中的各种数据。分布式数据计算核 ...

分类：其他好文时间：2020-12-28 11:29:22 阅读次数：0

2.1 什么是VMware vSphere

VMware vSphere 是业界领先且最可靠的虚拟化平台。能够通过虚拟化纵向扩展（存储扩展）和横向扩展（服务器扩展）应用、重新定义可用性和简化虚拟数据中心，最终可实现高可用、恢复能力强的按需基础架构，这是任何云计算环境的理想基础。同时可以降低数据中心成本，增加系统和应用正常运行时间，以及显著简化IT运行数据中心的方式。

分类：系统相关时间：2020-12-25 13:20:43 阅读次数：0

Hive中的UDF详解

hive作为一个sql查询引擎，自带了一些基本的函数，比如count(计数)，sum(求和)，有时候这些基本函数满足不了我们的需求，这时候就要写hive hdf(user defined funation)，又叫用户自定义函数。 UDF 创建与使用步骤继承org.apache.hadoop.hiv ...

分类：其他好文时间：2020-12-25 13:07:42 阅读次数：0

MySql大数据量查询limit与order by配合缓慢

大数据量在MySQL中查询分页排序，数据量就会很大我们可以把limit与order by拆分为两个步骤先根据条件把limit、ordey by相关的数据的索引查出来，然后再根据索引查询具体的字段信息（也就是两层嵌套）例： select id, user_name, id, user_name ...

分类：数据库时间：2020-12-25 13:04:20 阅读次数：0

win10+centos7+hadoop 集群环境搭建

一. 前期准备 1. Vmware workstation pro 16 官网下载 : https://www.vmware.com/ 密钥：ZF3R0-FHED2-M80TY-8QYGC-NPKYF （若失效请自行百度） 2. xshell,xftp 官网下载（需要注册） 3. 国内镜像网站下载c ...

分类：Windows程序时间：2020-12-25 12:00:06 阅读次数：0

Dubbo多协议支持

1.dubbo 协议 (默认) 1、采用单一长连接和NIO异步通讯，适合于小数据量大并发的服务调用，以及服务消费者机器数远大于服务提供者机器数的情况 2、不适合传送大数据量的服务，比如传文件，传视频等，除非请求量很低。用场景：常规远程服务方法调用特性连接个数：单连接连接方式：长连接传输协议 ...

分类：其他好文时间：2020-12-23 12:18:52 阅读次数：0

c#使用Confluent.Kafka实现生产者发送消息至kafka（远程连接kafka发送消息超时的解决 Local：Message timed out）

最近项目上因为遇到数据量过大导致查询统计性能问题（oracle数据库、单表每月1亿多条车辆定位记录，由一个windows环境下的链路服务程序来接收车辆上传的定位数据写入oracle），急需使用大数据架构来解决。前期同事已经提出整体解决思路（修改链路服务程序，在写oracle的基础上同时写入kafka ...

分类：Windows程序时间：2020-12-23 12:15:11 阅读次数：0

共28457条上一页 1 ... 24 25 26 27 28 ... 2846 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)