数据清洗一是为了解决数据质量问题,二是让数据更加适合做挖掘。数据清洗, 是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和最终结论。在实际操作中,数据清洗通常会占据分析过程的50%—80%的时间。在这里,小编跟大家介绍一下数据清洗的步骤和方法。 一、检查数据的质量 数据的完整性, ...
分类:
其他好文 时间:
2020-03-27 21:45:55
阅读次数:
105
1,几个概念: GIL: Global Interpreter Lock,全局解释器锁。为了解决多线程之间数据完整性和状态同步的问题,设计为在任意时刻只有一个线程在解释器中运行。 线程:程序执行的最小单位。 进程:系统资源分配的最小单位。 线程安全:多线程环境中,共享数据同一时间只能有一个线程来操作 ...
分类:
编程语言 时间:
2020-03-27 21:37:25
阅读次数:
92
解释:装饰器模式(Decorator Pattern)允许向一个现有的对象添加新的功能,同时又不改变其结构。这种类型的设计模式属于结构型模式,它是作为现有的类的一个包装。 这种模式创建了一个装饰类,用来包装原有的类,并在保持类方法签名完整性的前提下,提供了额外的功能。 装饰器模式的最主要的功能 1、 ...
分类:
编程语言 时间:
2020-03-27 13:08:32
阅读次数:
160
题目描述 在一个排序的链表中,存在重复的结点,请删除该链表中重复的结点,重复的结点不保留,返回链表头指针。 例如,链表1 2 3 3 4 4 5 处理后为 1 2 5 思路 用一个指针pre指向重复子链表的第一个节点的前一个节点,用另一个指针指向重复子链表的最后一个节点cur,这样遇到重复节点,使p ...
分类:
其他好文 时间:
2020-03-26 21:52:00
阅读次数:
95
前言 yarn是什么? 简单来说是和npm一样的包管理工具,并对npm的一些弊端提供了优化和解决方案 yarn和npm的区别? 安装速度更快,缓存了每个下载过的包,再次使用时无需重复下载。 同时利用并行下载以最大化资源利用率, 运行代码前会校验每个安装包的完整性和统一性,使其在不同系统上也能无差别的 ...
分类:
其他好文 时间:
2020-03-25 23:27:50
阅读次数:
82
装饰器模式(Decorator Pattern)允许向一个现有的对象添加新的功能,同时又不改变其结构。这种类型的设计模式属于结构型模式,它是作为现有的类的一个包装。 这种模式创建了一个装饰类,用来包装原有的类,并在保持类方法签名完整性的前提下,提供了额外的功能。 我们通过下面的实例来演示装饰器模式的 ...
分类:
其他好文 时间:
2020-03-25 19:10:56
阅读次数:
67
1. 关系型数据库与非关系型数据库 关系型数据库 优点:① 数据一致性高,冗余低,数据完整性好,便于操作 ② 逻辑类似于二维表格模型,容易理解 ③ 使用方便, 使用sql语句 缺点:① 每次操作要进行sql解析,消耗大 ② 不能满足高并发读写需求,特别是海量数据爆发时,关系型数据库的读写能力不足 ③ ...
分类:
数据库 时间:
2020-03-24 21:46:26
阅读次数:
79
为什么要分区和分表 我们的数据库数据越来越大,随之而来的是单个表中数据太多,以至于查询速度过慢,而且由于表的锁机制导致应用操作也受到严重影响,出现数据库性能瓶颈。 MySQL中有一种机制是表锁定和行锁定,是为了保证数据的完整性。表锁定表示你们都不能对这张表进行操作,必须等我对表操作完才行。行锁定也一 ...
分类:
数据库 时间:
2020-03-23 15:24:56
阅读次数:
91
MySQL-DAY03 1.约束 在创建表的时候,可以给表的字段添加相应的约束,添加约束的目的是为了保证表中数据的合法性、有效性、完整性。 常见约束: 非空约束(not null):约束的字段不能为NULL 唯一约束(unique):约束的字段不能重复 主键约束(primary key):约束的字段 ...
分类:
数据库 时间:
2020-03-21 21:41:26
阅读次数:
69
一 加密算法 应用于数据传输 通过算法,可以得到加密前的数据 二 消息摘要算法 应用于数据校验,比如文件完整性验证,存储密码 根据算法获得的结果长度是固定的,不同的算法有不同的数据长度 有不同消息获得同样运算结果,但概率极低 相同的数据通过同一个算法获得的结果一定相同 所以我们在说数据库存储用户密码 ...
分类:
编程语言 时间:
2020-03-21 13:03:11
阅读次数:
63