搜索关键字：hive hue xls，搜索到7606个结果！码迷,mamicode.com！

Hive 查询优化总结

一、join优化Join查找操作的基本原则：应该将条目少的表/子查询放在Join操作符的左边。原因是在Join操作的Reduce阶段，位于Join操作符左边的表的内容会被加载进内存，将条目少的表放在左边，可以有效减少发生内存溢出错误的几率。Join查找操作中如果存在多个join，且所有参与join的...

分类：其他好文时间：2014-07-22 22:56:14 阅读次数：238

Hive调优实战

Hive优化总结---by 食人花优化时，把hive sql当做map reduce程序来读，会有意想不到的惊喜。理解hadoop的核心能力，是hive优化的根本。这是这一年来，项目组所有成员宝贵的经验总结。长期观察hadoop处理数据的过程，有几个显著的特征:1.不怕数据多，就怕数据倾斜。2．对j...

分类：其他好文时间：2014-07-22 22:55:15 阅读次数：271

Hadoop的数据管理

Hadoop的数据管理，主要包括Hadoop的分布式文件系统HDFS、分布式数据库HBase和数据仓库工具Hive的数据管理。

分类：其他好文时间：2014-07-22 22:54:13 阅读次数：243

Hive一些参数设置

在使用union all的时候，系统资源足够的情况下，为了加快hive处理速度，可以设置如下参数实现并发执行set mapred.job.priority=VERY_HIGH;set hive.exec.parallel=true;设置map reduce个数-- 设置map capacityset...

分类：其他好文时间：2014-07-19 21:37:25 阅读次数：264

Python处理Excel（转载）

1. Python 操作 Excel 的函数库我主要尝试了 3 种读写 Excel 的方法：1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持，在任何操作系统上都可以使用。xlrd 可以读取 .xls, .xlsx 文件，非常好用；但因为 xlwt 不能直接修改 Exce...

分类：编程语言时间：2014-07-19 20:08:55 阅读次数：280

Hive架构层面优化之一分表

场景：某个日志表数据量很大，而且访问该表的作业比较多，造成耗时比较长；解决方案：将用的比较少/不常用的字段剥离出去；案例：日志表trackinfo，每天约有2亿数据量，有5000个作业按天访问，每天的日志数据量有可能会继续添加下去，那么很可能就满足不了要求（每添加10%的数据量作业大概要添加20分钟...

分类：其他好文时间：2014-07-18 20:35:32 阅读次数：192

Hive优化策略介绍

作为企业Hadoop应用的核心产品之一，Hive承载着公司95%以上的离线统计，甚至很多企业里的离线统计全由Hive完成；Hive在企业云计算平台发挥的作用和影响越来越大，如何优化提速已经显得至关重要；Hive作业的规模决定着优化层级，一个Hive作业的优化和一万个Hive作业的优化截然不同；后续文...

分类：其他好文时间：2014-07-17 13:13:40 阅读次数：266

Hive架构层面优化之四常用复杂/低效的统计从源上给出，以避免上层作业过多计算

案例一：trackinfo，基础表处理常用的低性能UDF背景描述：日志信息10分钟加载一次到实时日志表trackreal中（按小时分区），为了保证实时性，在加载的过程中并没有做任何的过滤处理，加载到trackreal表后再过滤非法数据、爬虫数据等，生成按天增量日志表trackinfo，然后根据不同的...

分类：其他好文时间：2014-07-17 13:09:44 阅读次数：226

poi读取xlsx

知道大家都知道用poi读取xls 当时有时候必须要读取xlsx 现在我把我做测试的demo分享给大家 package com.lt.main; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import java.sql.Connection; import ja...

分类：其他好文时间：2014-07-16 13:22:18 阅读次数：197

共7606条上一页 1 ... 743 744 745 746 747 ... 761 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)