码迷,mamicode.com
首页 >  
搜索关键字:数据脱敏 datamasker 数据漂白 数据清洗    ( 383个结果
数据清洗--DataFrame中的空值处理
数据清洗是一项复杂且繁琐的工作,同时也是整个数据分析过程中最为重要的环节。 在python中空值被显示为NaN。首先,我们要构造一个包含NaN的DataFrame对象。 删除表中全部为NaN的行 删除表中任何含有NaN的行 删除表中全部为NaN的列 删除表中任何含有NaN的列 注意:axis 就是” ...
分类:其他好文   时间:2018-09-30 12:57:50    阅读次数:214
数据挖掘流程
数据挖掘流程: (一)数据读取: 读取数据,并进行展示 统计数据各项指标 明确数据规模与要完成任务 (二)特征理解分析 单特征分析,逐个变量分析其对结果的影响 多变量统计分析,综合考虑多种情况影响 统计绘图得出结论 (三)数据清洗与预处理 对缺失值进行填充 特征标准化/归一化 筛选有价值的特征 分析 ...
分类:其他好文   时间:2018-09-27 00:12:50    阅读次数:202
大数据脱敏
简介 大数据平台通过将所有数据整合起来,充分分析与挖掘数据的内在价值,为业务部门提供数据平台,数据产品与数据服务。大数据平台接入的数据中可能包括很多用户的隐私和敏感信息,如用户在酒店的入住纪录,用户支付信息等,这些数据存在可能泄漏的风险。大数据平台一般通过用户认证,权限管理以及数据加密等技术保证数据 ...
分类:其他好文   时间:2018-09-25 19:33:34    阅读次数:189
超全数据挖掘面试笔试题(附答案)转
一、单选题(共80题) ( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则 ...
分类:其他好文   时间:2018-09-20 21:17:07    阅读次数:221
数据分析---用pandas进行数据清洗(Data Analysis Pandas Data Munging/Wrangling)
这里利用ben的项目(https://github.com/ben519/DataWrangling/blob/master/Python/README.md),在此基础上增添了一些内容,来演示数据清洗的主要工作。 以下是一份简单的交易数据,包括交易单号,交易日期,产品序号,交易数量,单价,总价。 ...
分类:其他好文   时间:2018-09-18 19:15:34    阅读次数:132
机器学习(1)数学基础
1.机器学习定义:是人工智能的一个分支。我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断的学习和改进;通过参数优化的学习模型,能够用于预测相关问题的输出 2.机器学习的一般过程:(1)数据收集 》(2)数据清洗 》(3)特征工程 ...
分类:其他好文   时间:2018-09-14 13:56:28    阅读次数:160
Oracle汉字用户名数据脱敏长度不变,rpad函数使用
信息安全考虑,有时需要对用户名称进行数据脱敏。 针对Oracle数据库,进行取数数据脱敏处理 脱敏规则: 长度小于9个字符,只保留前3个汉字与后3个汉字,中间全部由*填充。 长度9个字及以上及奇数,隐去中间3个字;长度10个字及以上及奇数,隐去中间4个字。 例如: 公司名称:宇宙无敌厉害的超级大公司 ...
分类:数据库   时间:2018-08-30 20:12:23    阅读次数:2417
基于Impala平台打造交互查询系统
本文来自网易云社区 原创: 蒋鸿翔 DataFunTalk 本文根据网易大数据蒋鸿翔老师DataFun Talk——“大数据从底层处理到数据驱动业务”中分享的《基于Impala平台打造交互查询系统》编辑整理而成,在未改变原意的基础上稍做整理。 以上是今天的内容大纲,第一个讲一下交互式查询的特点,在大 ...
分类:其他好文   时间:2018-08-30 13:20:09    阅读次数:181
Python基本的数据清洗
接触Python两年多了,还从来没有独立用Python完成一个项目,说来惭愧。最近因为工作需要,用Excel和oracle整理数据貌似不可行了,于是转向Python,理所当然的踩了很多坑,一一记录下来,避免以后再次入坑,毕竟不常用,好了伤疤就会忘了疼··· 业务场景: 领导拿来几个Excel,共15 ...
分类:编程语言   时间:2018-08-19 18:04:14    阅读次数:183
java 日志的数据脱敏
思路 1。在 model层进行处理,直接重写get方法,在写一个getPlain 获取明文方法。(缺点:数据库写入和json序列化传递时使用的都是密文) 2.利用 日志组件过滤 特定的key,去进行脱敏(缺点:对所有的日志输出全部要正则匹配,非常耗时。) 由1,2的利弊,肯定会选择1,然后考虑一种实 ...
分类:编程语言   时间:2018-08-16 17:35:51    阅读次数:326
383条   上一页 1 ... 19 20 21 22 23 ... 39 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!