摘记: 离散化 即把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率 通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如: 原数据:1,999,100000,15; 处理后:1,3,4,2; 原数据:{100,200},{20,50000},{1,400}; ...
分类:
其他好文 时间:
2017-04-08 21:47:15
阅读次数:
179
51Nod--1285-山峰和分段 1285 山峰和分段 题目来源: Codility 基准时间限制:1 秒 空间限制:131072 KB 分值: 20 难度:3级算法题 收藏 关注 51Nod--1285-山峰和分段 1285 山峰和分段 题目来源: Codility 基准时间限制:1 秒 空间限 ...
分类:
其他好文 时间:
2017-03-11 23:40:05
阅读次数:
181
数据选择器 1.这里讲解一个特殊情况,如果给定的函数是F(A,B,C,D)拥有四个变量,要求我们采用74151八选一数据选择器来实现四变量的函数。74151八选一数据选择器的地址端只有三个,和四个变量对不上,该怎么解决这个问题。这里的解决办法有两种:74151八选一数据选择器增加一个地址端;降变量, ...
分类:
其他好文 时间:
2017-03-11 11:36:25
阅读次数:
168
线性回归 优点:结果易于理解,计算上不复杂 缺点:对非线性的数据拟合不好 适用数据类型:数值型和标称型数据 回归的目的就预测数值型的目标值。最直接的办法就是依据输入写一个目标值的计算公式。这个计算公式就是所谓的回归方程(regression equation),其中的参数就是回归系数,求这些回归系数 ...
分类:
其他好文 时间:
2016-12-22 00:26:09
阅读次数:
263
所谓代码优化是指对程序代码进行等价(指不改变程序的运行结果)变换。程序代码可以是中间代码(如四元式代码),也可以是目标代码。等价的含义是使得变换后的代码运行结果与变换前代码运行结果相同。优化的含义是最终生成的目标代码短(运行时间更短、占用空间更小),时空效率优化。原则上,优化可以再编译的各个阶段进行 ...
分类:
其他好文 时间:
2016-12-13 19:34:24
阅读次数:
233
1、定义目标 调研业务目标 评析环境 确定挖掘目标 制定计划2、数据理解 收集原始数据 探索数据 检验数据质量3、数据准备 数据选取 抽取建模数据 数据预处理4、建立模型 选择建模技术 建立模型 评估和改进模型 模型评价5、部署实施 制定实施计划 模型实施 项目总结和评价 ...
分类:
其他好文 时间:
2016-12-12 19:47:43
阅读次数:
191
问题到数据 理解问题 理解客户的问题:谁是客户(某航空公司)?交流,交流,交流! 问题要具体 某航空公司: 乘客体验如何?哪方面需要提高? 类别:比较、描述、聚类,判别还是回归 需要什么样的数据:现有数据,数据质量,需要收集的数据,自变量,因变量 哪些方面的满意度?哪些主要竞争对手? 内部数据?外部 ...
分类:
其他好文 时间:
2016-10-27 21:00:00
阅读次数:
347
一、数据挖掘 定义与目标 1.1 概念:数据里面找规律 一个过程 1.2 dm与报表差别 1.3 dm应用最多-客户关系CRM 1.4 业务分析优化演进 分八步骤: 1.5 业务闭环-洞察力营销 十步骤: 1.6 DM方法论: CRISP-DM -商业理解、数据理解、数据准备、建立模型、模型评估、模 ...
分类:
其他好文 时间:
2016-09-25 09:33:17
阅读次数:
124
一. 生产者/消费者模式 概念:生产者产生一块数据,放到buffer中,与此同时,消费者在从buffer中取出并消耗这些数据 理解:像生活中厂家生产出产品,顾客购买消耗这些产品,buffer就是存放商品的仓库。 二. 生产者/消费者模式在python中的实现 相关模块:Queue模块 简单介绍:Py ...
分类:
编程语言 时间:
2016-09-05 20:53:24
阅读次数:
152
散点图 曲线直线化:变量变换后拟合线性模型、曲线拟合模型 非线性模型 残差的独立性、正态性、方差齐性检验 预测值 1、案例背景 利用某车企过去14年的汽车销售量来预测未来2-3年的销售量。变量:时间、销售量 2、数据理解 画时间与销售量的散点图,发现以下三类关键信息: 变量间是否存在数量关联趋势; ...
分类:
其他好文 时间:
2016-07-08 19:38:44
阅读次数:
279