一、聚簇索引 数据与索引放在一起,找到索引就找到数据 二、非聚簇索引 数据与索引存储分开 使用场景 动作描述 使用聚簇索引 使用非聚簇索引 列经常被分组排序 应 应返回某范围内的数据 应 不应一个或极少不同值 不应 不应小数目的不同值 应 不应大数目的不同值 不应 应频繁更新的列 不应 应外键列 应 ...
分类:
其他好文 时间:
2020-03-21 15:05:22
阅读次数:
48
业务需求:需要实现分组排序并取组内状态优先级最高的数据。 示例:这里有一张这样的数据表,需求是根据error_type分组然后取status最小的第一条数据,如图: 写法一(无法实现): select t.* from ( select e.* from error_record e where e ...
分类:
数据库 时间:
2020-03-13 11:28:02
阅读次数:
142
记录LINQ学习过程。 概要 LINQ是一种“语言集成”的查询表达式,使用LINQ可以智能提示和进行类型检查。C#里可以编写的LINQ查询有SQL数据库、XML文档、ADO.NET数据集、支持IEnumerable和IEnumerable的对象。使用LINQ,可以简单对数据源进行分组、排序、筛选。有 ...
分类:
其他好文 时间:
2020-02-22 22:26:50
阅读次数:
104
1.1.1 全排序 (1)全排序概述 指的是让所有的输出结果都是有序的,最简单的方法就是用一个reduce任务,但是这样处理大型文件时效率极低,失去的并行架构的意义。所以可以采用分组排序的方法来实现全局排序,例如现在要实现按键的全局的排序,可以将键值按照取值范围分为n个分组,<-10℃,-10℃~0 ...
分类:
编程语言 时间:
2020-02-16 01:31:26
阅读次数:
63
1、row_number over():分组排序+序号标记 假如我们有这样一组数据,我们需要求出不同性别的年龄top2的人的信息。这个时候怎么做?可能我们会首先想到分组,但是分组只能值top1,怎么样能求出top2,top3呢?这时候我们想如果分组后能够按照年龄排序然后标出来序号就好了! id ag ...
分类:
其他好文 时间:
2020-02-13 17:21:11
阅读次数:
75
MapReduce与spark MapReduce: 操作单一,只有map,reduce spark:提供多种操作:过滤,分组,排序.... (一)spark生态环境: Mesos和YARN都是资源调度管理器 HDFS:分布式系统存储组件 S3:亚马逊提供的云端的简单的存储服务 Tachyon:基于 ...
分类:
其他好文 时间:
2020-01-28 20:53:14
阅读次数:
68
什么是Stream? Stream它并不是一个容器,它只是对容器的功能进行了增强,添加了很多便利的操作,例如查找、过滤、分组、排序等一系列的操作。并且有串行、并行两种执行模式,并行模式充分的利用了多核处理器的优势,使用fork/join框架进行了任务拆分,同时提高了执行速度。简而言之,Stream就 ...
分类:
编程语言 时间:
2020-01-09 13:31:01
阅读次数:
99
希尔排序 希尔排序是一个叫希尔的数学家提出的一种优化版本的插入排序。 首先取一个整数d1=n//2,将元素分为d1个组,每组相邻元素之间的距离为d1,在各组内进行直接插入排序。 取第二个整数d2=d1//2,重复上述分组排序过程,直到di=1,即所有元素在同一组内进行直接插入排序。 希尔排序是使整体 ...
分类:
编程语言 时间:
2019-12-25 15:53:09
阅读次数:
72
CREATE TABLE `test` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(255) CHARACTER SET latin1 DEFAULT NULL, `category_id` int(11) DEFAULT NULL, ...
分类:
数据库 时间:
2019-12-13 12:16:23
阅读次数:
84
问题描述 我们现在有一张表titles,共有4个字段,分别是emp_no(员工编号),title(职位),from_date(起始时间),to_date(结束时间),记录的是员工在某个时间段内职位名称,因为会存在升职,转岗之类的,里面emp_no可能会对应多个职位,我们现在要取到所有员工最近的职位信 ...
分类:
数据库 时间:
2019-12-08 15:25:11
阅读次数:
120