摘要:有人推崇产品,有人推崇运营,也有人推崇战略…到底该推崇什么?李智勇系统地分析了这三者之间的思路,并引用黑格尔的一句话,给出了自己的看法:在尺度中已经蕴含本质,这在产品、运营、战略的侧重上体现的非常好。视野不拉升或者认知不深入时,就容易在盲人摸象层面上反复,看到微信火了,那就产品最重要,看到阿里...
分类:
其他好文 时间:
2015-03-07 00:58:43
阅读次数:
167
详解机器学习中的数据清洗与特征处理在海军陆战队服役超过 10 年后,我于去年 7 月份退役了。随后在 8 月份找到了一份赌场的工作做公关,到今年 2 月中旬的时候又被辞退了。到 5 月中旬的时候我在 DE 协会找到了一份临时的“初级用户体验工程师”工作,而到了 8 月底我则成了正式的“用户体验工程师...
分类:
其他好文 时间:
2015-02-12 00:37:36
阅读次数:
344
package com.bank.service;import java.io.IOException;import java.text.ParseException;import java.text.SimpleDateFormat;import org.apache.hadoop.conf.Co...
分类:
其他好文 时间:
2015-01-15 20:00:39
阅读次数:
204
数据质量问题分类 本文主要讨论实例层数据质量问题 数据质量评价(12个维度) 1)数据规范(Data specification):对数据标准、 数据模型、业务规则、元数据和参考数据进行有关存在性、完整性、质量及归档的测量标准; 2)数据完整性准则(Data integrity fundamenta...
分类:
其他好文 时间:
2015-01-02 23:37:56
阅读次数:
348
王曰芬 章成志 张蓓蓓 吴婷婷 定义:数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 目的:数据清洗的目的是为信息系统提供准确而有效的数据。 基本原理:利用有关技术,如统计方法、数据...
分类:
其他好文 时间:
2015-01-02 22:25:20
阅读次数:
309
(1)准备。包括需求分析、信息环境分析、任务定义、方法定义、基本配置,以及基于以上工作获得数据清洗方案等。通过需求分析明确信息系统的数据清洗需求,通过信息环境分析明确数据所处的信息环境特点,任务定义要明确具体的数据清洗任务目标,方法定义确定合适的数据清洗方法,基本配置完成数据接口等的配置,要形成完整...
分类:
其他好文 时间:
2015-01-02 22:17:33
阅读次数:
200
Clojure数据分析秘笈
目录
1
导入分析数据2
清洗和校验数据3
使用并发编程管理复杂度4
使用并行编程提高性能5
Cascalog6
使用Incanter数据集7
使用Incanter准备并执行数据分析8
使用Mathematica和R9
聚类、分类和使用Weka10
使用Incanter绘图11
创建网页图表
导入分析数据
...
分类:
其他好文 时间:
2014-11-10 10:02:17
阅读次数:
241
一、数据预处理1、数据如果能够满足其应用的要求,那么他是高质量的。 数据质量涉及许多因素:准确性、完整性、一致性、时效性、可信性、可解释性。2、数据预处理的主要任务:数据清洗、数据集成、数据规约、数据变换。二、数据清理:试图填充缺失值,光滑噪声、识别利群点、纠正数据中的不一致。1、缺失值的处理:1)...
分类:
其他好文 时间:
2014-10-25 22:56:59
阅读次数:
291
为什么要对数据仓库分层?用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据;如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个...
分类:
其他好文 时间:
2014-10-09 19:39:37
阅读次数:
528