直方图
当某列数据分布不均衡,为了让CBO能生成最佳的执行计划,我们可能需要对表收集直方图,直方图最大的桶数(Bucket)是254。
收集直方图是一个很耗时的过程,如无必要,千万别去收集直方图。
Oracle的直方图有两种:
一种是频率直方图(FREQUENCY HISTOGRAM),当列中Distinct_keys 较少(小于254),如果不手工指定直方图桶数(BUCKET),Oracle...
分类:
数据库 时间:
2014-10-24 16:31:37
阅读次数:
360
互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库。在这样严峻的条件下,一批又一批的创业者从创业中获得成功,这个和当前的开源技术、海量数据架构有着必不可分的关系。比如我们使用mysql、nginx等开源软件,通过架构和低成本服务器也可以搭建千万级用户访问量的系...
分类:
其他好文 时间:
2014-10-17 18:24:28
阅读次数:
176
从传统数据库迁移到GP中一个重要的且经常被开发人员忽略的概念是数据分布,没有良好的设计表的分布键会导致严重的性能问题,以下函数将给开发人员及DBA检测一个表的数据倾斜情况。
-- Function: gpmg.data_skew(character varying)
-- DROP FUNCTION gpmg.data_skew(character varying);
CREATE OR...
分类:
其他好文 时间:
2014-10-14 12:35:58
阅读次数:
266
1、复制概述1.1、复制解决的问题 数据复制技术有以下一些特点: (1) 数据分布 (2) 负载平衡(load balancing) (3) 备份 (4) 高可用性(high availability)和容错1.2、复制如何工作 从高层来看,复制分成三步: (1) master将改变记录到二进制日志...
分类:
数据库 时间:
2014-09-28 20:18:45
阅读次数:
251
现状集群已不是什么新技术了,各个数据库厂商也都有了自己的成熟解决方案,目前数据库集群系统应用得比较成功,应用范围比较广泛的是:Oracle公司的Oracle9与IBM公司DB2。Oracle9采用Shared-storage的技术,DB2选择了Shared-nothing的技术,二者各有长短。
最新的数据库集群系统的理论基础是分布式计算,将数据分布到每个节点,所有的计算节点并行处...
分类:
数据库 时间:
2014-09-24 19:36:27
阅读次数:
341
51的内容长度限制,这里继续rediscluster的简单使用和维护。7,下面简单测试一下cluster7.1测试数据分布使用redis-cli来测试clustershard,可以看到foo->bar被存储到了7002节点上,并且自动跳转到了7002上,然后7002上hello-world是存储在7000上,再次重定向到7000节点上了..
分类:
其他好文 时间:
2014-09-16 16:08:51
阅读次数:
386
grep 由于内置高效的字符串搜索算法,兼容各种风格的正则,且功能众多,有着 linux 下字符串处理三剑客之一的称号,但是到了如今的大数据/分布式时代,这种单机时代的工具显得有些廉颇老矣。。。 1、需求背景 我们...
分类:
其他好文 时间:
2014-09-11 04:33:02
阅读次数:
670
方法一:
在目前绝大部分数据库有分布式查询的需要。下面简单的介绍如何在oracle中配置实现跨库访问。
比如现在有2个数据库服务器,安装了2个数据库。数据库server A和B。现在来实现在A库中访问B的数据库。
第一步、配置A服务器端的tnsnames.ora文件(TNSNAMES.ORA Network Configuration File),该文件存放的位置为:
$O...
分类:
数据库 时间:
2014-08-28 16:17:19
阅读次数:
288
写在前面的话:以下是最简单的join原理,为后面的大数据分布式join做概念复习和知识铺垫:有时为了得到完整的结果,我们需要从两个或更多的表中获取结果。我们就需要执行 join。JOIN: 如果表中有至少一个匹配,则返回行LEFT JOIN: 即使右表中没有匹配,也从左表返回所有的行RIGHT JO...
分类:
数据库 时间:
2014-08-26 13:36:36
阅读次数:
228
1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础。将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台主机的数据复制到其它主机(slaves)上,并重新执行一遍来实现的。复制过程中一个服务器充当主服务器,而一个或多个其它服务器充当从服务器。主服务器将...
分类:
数据库 时间:
2014-08-21 19:19:14
阅读次数:
355