搜索关键字：hive tez sql 优化，搜索到124570个结果！码迷,mamicode.com！

sqoop将hive数据导出到myql乱码问题解决

进入myql 执行 show variables like 'character%'; 看到如下：乱码原因，databases编码格式不一致导致的乱码，解决方法如下：方法一：执行如下两个命令即可： set character_set_database=utf8; set character_s ...

分类：其他好文时间：2021-06-19 19:06:39 阅读次数：0

Hive不常用操作记录

Hive列转行： select school,concat_ws('|',collect_set(name)) as name from tmp_01 group by school; 注意：collect_set 有重复的会去重， collect_list 有重复的不去重 hive行转列： sel ...

分类：其他好文时间：2021-06-19 19:05:46 阅读次数：0

UVA11732 【"strcmp()" Anyone?】

如果按照题意模拟的话是肯定会超时的（题目都好心告诉你了），考虑优化。我们发现对于两个串我们只用求它们的最长公共前缀即可。如果将所有串建一棵$trie$，那最长公共前缀就对应到它们的结束节点在$trie$树上的$lca$。所以我们建好$trie$后只用遍历一遍所有节点看看它是几个串的$lca$即可 ...

分类：其他好文时间：2021-06-19 18:47:32 阅读次数：0

聚焦 | 数据湖分析如何面向对象存储OSS进行优化？

简介：最佳实践，以DLA为例子。DLA致力于帮助客户构建低成本、简单易用、弹性的数据平台，比传统Hadoop至少节约50%的成本。其中DLA Meta支持云上15+种数据数据源（OSS、HDFS、DB、DW）的统一视图，引入多租户、元数据发现，追求边际成本为0，免费提供使用。DLA Lakehou ...

分类：其他好文时间：2021-06-18 20:06:29 阅读次数：0

mysql8更改大小写敏感（现网环境）

恢复内容开始 1、备份数据操作服务器：主数据库 #备份mysql中所有数据库数据./mysqldump -h主数据库ip -uroot -p -P3308 --all-databases > /data0/all_db.sql 2、停库操作服务器：主备数据库均操作 systemctl stop ...

分类：数据库时间：2021-06-18 20:00:25 阅读次数：0

数据倾斜的原因是什么，如何解决

key 分布不均匀业务数据本身的欠缺性建表设计方法不对有些 SQL 难免会有一下数据倾斜不可避免表现的形式：任务完成进度卡死在99%，或者进度完成度在100%但是查看任务监控，发现还是有少量（1个或几个）reduce 子任务未完成。因为其处理的数据量和其他 reduce 差异过大。单一re ...

分类：其他好文时间：2021-06-18 19:56:57 阅读次数：0

MySQL 百万级数据分页查询优化

方法1: 直接使用数据库提供的SQL语句语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N 适应场景: 适用于数据量较少的情况(元组百/千级) 原因/缺点: 全表扫描,速度会很慢且有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2, ...

分类：数据库时间：2021-06-18 19:51:23 阅读次数：0

数据预处理与转存（Hive--Mysql）

一、数据预处理 1.1、在hdfs上新建目录 java程序启动前先在hdfs上建立相应文件夹，用于上传本地数据和处理后的数据 [root@hadoop102 ~]# hdfs dfs -mkdir -p /USAdatas/geodatas/inputs [root@hadoop102 ~]# hd ...

分类：数据库时间：2021-06-18 19:17:01 阅读次数：0

sql server 模糊查询通配符%和下划线无法匹配问题

在sql server的like中%和下划线类似于通配符%，所以无法使用like '%%'来匹配，可以通过以下两种办法实现匹配 1、使用escape 来解决 like '%_%' escape '' like '%|_%' escape '|' 这里的escape就是将后面的字符指定为转义字符，可以 ...

分类：数据库时间：2021-06-18 19:07:15 阅读次数：0

代码训练3，图像分类模型代码

图像分类train.py代码总结前两天，熟悉了图像分类的训练代码，发现，不同网络，只是在网络结构上不同。而训练部分的代码，都是由设备选择、数据转换，路径确定、数据导入、JSON文件生成、损失函数选择、优化器选择、模型带入和训练集数据和测试集数据训练固定几部分组成的。其中的模型是根据自己选择的不同 ...

分类：其他好文时间：2021-06-18 18:50:14 阅读次数：0

共124570条上一页 1 ... 18 19 20 21 22 ... 12457 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)