三大表与表联接方式 1.NESTED LOOPS 嵌套循环 2.HASH JOIN 哈希联接 3.SORT MERGE 排序合并联接 1.NESTED LOOPS 嵌套循环 嵌套循环的本质是将外部数据集连接到内部数据集,对于外部数据集中与单表谓词匹配的每一行,数据库将检索内部数据集中满足连接谓词的所 ...
分类:
数据库 时间:
2020-07-19 21:11:39
阅读次数:
94
进程与线程的关系和区别 一、定义 进程:具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。 线程:是进程的一个实体,是cpu调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源,但 ...
分类:
编程语言 时间:
2020-07-19 16:01:09
阅读次数:
67
Mnist手写数字识别 Tensorflow 任务目标 了解mnist数据集 搭建和测试模型 编辑环境 操作系统:Win10 python版本:3.6 集成开发环境:pycharm tensorflow版本:1.* 了解mnist数据集 mnist数据集:mnist数据集下载地址 MNIST 数据集 ...
分类:
其他好文 时间:
2020-07-18 20:01:40
阅读次数:
78
Keras之队鸢尾花识别 任务目标 对鸢尾花数据集分析 建立鸢尾花的模型 利用模型预测鸢尾花的类别 环境搭建 pycharm编辑器搭建python3.* 第三方库 numpy pandas sklearn keras 处理鸢尾花数据集 了解数据集 鸢尾花数据集是一个经典的机器学习数据集,非常适合用来 ...
分类:
其他好文 时间:
2020-07-18 16:10:24
阅读次数:
128
需求: http://quotes.money.163.com/service/chddata.html?code=1002566&start=20150104&end=20160108 我们可以通过雅虎网站获取了中国股市(深市)数据集,它以csv数据格式存储: date,open,High,Low ...
分类:
其他好文 时间:
2020-07-18 00:41:21
阅读次数:
84
02 集中趋势的度量 基本概念 异常值: 与其他数据格格不入的极高或极低的数值。 偏斜数据:当异常值将数据向左或向右“拉”时即产生偏斜数据。 众数:众数是频数最大的数值。众数必须存在于数据集中。众数是唯一能用于类别数据 的平均数。 均值 中位数 四分位数:四分位数是这样一些数值,他们将数据一分为四。 ...
分类:
其他好文 时间:
2020-07-17 16:07:23
阅读次数:
95
超参数和模型参数 如何寻找最好的超参数? 1.领域知识 2.经验数值 3.实验搜索 也可以设置程序对k值进行筛选: 可以看出,对于手写数字数据集来说,最好的k值是4. (如果获得的最好k值在循环边界处,那么需要稍微拓展一下搜索范围,可能会找到更好的k值) knn算法还有一个重要的超参数就是——距离权 ...
分类:
编程语言 时间:
2020-07-16 12:24:54
阅读次数:
64
数据可视化的本质是视觉对话,数据可视化将数据分析技术与图形技术结合,清晰有效地将分析结果信息进行解读和传达。大数据可视化是进行各种大数据分析解决的最重要组成部分之一。一旦原始数据流被以图像形式表示时,以此做决策就变得容易多了。为了满足并超越客户的期望,大数据可视化工具应该具备这些特征:1·能够处理不同种类型的传入数据2·能够应用不同种类的过滤器来调整结果3·能够在分析过程中与数据集进行交互4·能够
分类:
其他好文 时间:
2020-07-16 12:16:59
阅读次数:
387
sql查询语句优化 1、对查询进行优化,应尽量避免全表扫描 a、 where 及 order by 涉及的列上建立索引 b、 尽量避免在 where 子句中对字段进行 null 值判断,可以将null值设置默认值0等,如:将select id from t where num is null变为se ...
分类:
数据库 时间:
2020-07-16 12:10:58
阅读次数:
81
集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。 注意: 去重,把一个列表变成集合,就自动去重了 关系测试,测试两组数据之间的交集、差集、并集等关系 集合(set)是一个无序的不重复元素序列可以使用大括号{}或者set{}函数 ...
分类:
编程语言 时间:
2020-07-16 00:12:19
阅读次数:
68