''' KNN 近邻算法,有监督学习算法 用于分类和回归 思路: 1.在样本空间中查找 k 个最相似或者距离最近的样本 2.根据这 k 个最相似的样本对未知样本进行分类 步骤: 1.对数据进行预处理 提取特征向量,对原来的数据重新表达 2.确定距离计算公式 计算已知样本空间中所有样本与未知样本的距离 ...
分类:
编程语言 时间:
2020-04-10 11:57:22
阅读次数:
77
约束 概述 为了保证数据的一致性和完整性,SQL规范以约束的方式对表数据进行额外的条件限制。 约束是表级的强制规定。 可以在创建表的时候添加约束,或者在表创建之后数据添加之前添加约束。 约束类型 有如下的六大约束: NOT NULL,非空约束,规定某个字段不能为空。 UNIQUE,唯一约束,规定某个 ...
分类:
数据库 时间:
2020-04-09 14:15:49
阅读次数:
95
在 "前面" 的学习中主要了解了Pandas如何构造序列和数据框,如何读取和写入各种格式的数据,以及如何对数据进行初步描述,本文将进一步了解Pandas如何处理字符串和日期数据,数据清洗,获取数据子集,透视表,分组聚合操作等内容。 4. Pandas处理字符串和日期数据 待处理的数据表 数据处理要求 ...
分类:
编程语言 时间:
2020-04-09 12:58:30
阅读次数:
103
1 package com.liuhuan; 2 3 import org.apache.hadoop.io.WritableComparable; 4 5 import java.io.DataInput; 6 import java.io.DataOutput; 7 import java.io ...
分类:
其他好文 时间:
2020-04-07 18:45:58
阅读次数:
102
1.通过外部文件导入数据表 2.通过填入数据生成数据表 3.检查数据表的维度:shape属性 结果输出 (6,6) 4.查看数据表信息 5.查看数据表数据格式:dtypes属性 6.空值检查isnull()函数(非空False,空True) 7.查看某列数据唯一值:unique()函数 8.查看列名 ...
分类:
编程语言 时间:
2020-04-07 12:56:07
阅读次数:
104
以该图为例 创建基本表 数据类型 约束条件 主键 primary key 外键 foreign key 创建一个存放学生信息的数据库s_t:create database s_t; 接下来开始建表,建表前先确认是在s_t数据库中建表,所以得先进入此数据库:use s_t;顺便可以看看当前数据库里有那 ...
分类:
数据库 时间:
2020-04-07 00:24:45
阅读次数:
122
1、数组与链表 我们至少可以通过两种结构来存储数据 数组 优点: 存取速度快 缺点: 需要一个连续的很大的内存 插入和删除元素的效率很低 链表 专业术语: 首节点 存放第一个有效数据的节点 尾节点 存放最后一个有效数据的节点 头结点 头结点的数据类型和首节点的类型是一摸一样的 头结点是首节点前面的那 ...
分类:
其他好文 时间:
2020-04-06 19:05:55
阅读次数:
69
-- 查询测试表数据select * from test -- 对avg列进行升序 select kechenghao,avg as avg from test ORDER BY avg asc -- 对avg列升序,然后对课程表进行降序,注意 课程表数字的变化select kechenghao,a ...
分类:
其他好文 时间:
2020-04-06 15:31:39
阅读次数:
86
数据分库后报表只能做 T+1 或 T+n 查询,业务需要的 T+0 实时查询往往无法满足。原因是分库(异构库)后的 SQL 没法写,通过硬编码实现的复杂度又太高。本文将介绍一种简单的方式:使用润乾报表快速实现冷热数据分离后的全量 T+0 实时查询。 ...
分类:
其他好文 时间:
2020-04-06 09:28:47
阅读次数:
99
管理表数据 关系数据库的基本操作就是增删改查,即CRUD:Create、Retrieve、Update、Delete。其中,对于查询,我们已经详细讲述了 语句的详细用法。 而对于增、删、改,对应的SQL语句分别是: INSERT:插入新记录; UPDATE:更新已有记录; DELETE:删除已有记录 ...
分类:
数据库 时间:
2020-04-05 15:48:05
阅读次数:
136