搜索关键字：数据清洗，搜索到368个结果！码迷,mamicode.com！

Python 数据清洗--处理Nan

参考：http://blog.sina.com.cn/s/blog_13050351e0102xfis.html https://www.sogou.com/link?url=DOb0bgH2eKh1ibpaMGjuy bS_O7xQYLPIOogrOFmc02ueKW9M67CaVLpMY1k7w ...

分类：编程语言时间：2019-04-03 16:40:21 阅读次数：231

数据清洗一：

原数据格式：转换的目标格式：利用pandas包对excel表中的内容进行读取: pd.read_excel() 主要函数解读： io表格具体路径，sheetname 读取表格中的哪个Sheet，可以是整数或Sheet名称，converters 指定将读取内容转换成哪种格式 eg: convert ...

分类：其他好文时间：2019-03-28 16:50:43 阅读次数：169

数据清洗

数据清洗(Data Cleaning)——https://wiki.mbalib.com/wiki/%E6%95%B0%E6%8D%AE%E6%B8%85%E6%B4%97 目录 [隐藏] 目录 1 什么是数据清洗[1] 2 数据清洗原理[2] 3 数据清洗的实现方式与范围[2] 4 数据清洗的方法 ...

分类：其他好文时间：2019-03-24 10:02:24 阅读次数：244

数据挖掘中数据清洗的方法

数据清洗一是为了解决数据质量问题，二是让数据更加适合做挖掘一、解决数据质量问题数据的完整性，比如人的属性中缺少性别、籍贯、年龄等数据的唯一性，比如不同来源的数据出现重复的情况数据的权威性，比如同一个指标出现多个来源的数据，且数值不一样数据的合法性，比如数据与常识不符，市区内开车速度到达了4 ...

分类：其他好文时间：2019-03-24 09:20:44 阅读次数：123

JFinal-美女图爬虫-一个不正经的爬虫代码

，使用JFinal+JSoup组合，抓取数据，数据清洗筛选，最终保存到数据库里，结构化 ...

分类：其他好文时间：2019-03-17 01:15:17 阅读次数：221

AI学习---特征工程(Feature Engineering)

为什么需要特征工程(Feature Engineering) 数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已什么是特征工程帮助我们使得算法性能更好发挥性能而已 sklearn主要用于特征工程pandas主要用于数据清洗、数据处理特征工程包含如下3个内容： 1、特征抽取/特征提... ...

分类：其他好文时间：2019-03-08 22:07:22 阅读次数：610

Event Recommendation Engine Challenge分步解析第三步

一、请知晓本文是基于Event Recommendation Engine Challenge分步解析第一，二步，需要读者先阅读前两篇文章解析二、用户社交关系信息处理这一步需要user_friends.csv.gz文件，我们先来看看文件内容：代码示例结果（发现该记录了用户的所有朋友信息）： ...

分类：其他好文时间：2019-03-08 17:14:38 阅读次数：206

Pandas 数据清洗常用篇

一.缺失值 sklearn中的preprocessing下游imputer，可进官方文档参考。这里主讲pandas。拿到数据，一般先检查是否有缺失值，用isnul()或notnull(). 再决定dropna()，还是fillna()。 1.1 检查是否有缺失值 isnull()、notnull( ...

分类：其他好文时间：2019-03-07 00:52:10 阅读次数：239

pandas 连接数据库直接查表建立dataframe。loc，sort_values数据清洗操作

#导入pandas import pandas as pd import numpy as np #导入SqlAlchemy from sqlalchemy import create_engine if __name__ == "__main__": #建立数据库引擎 engine = creat... ...

分类：数据库时间：2019-03-06 12:08:04 阅读次数：196

[Python数据挖掘]第6章、电力窃漏电用户自动识别

一、背景与挖掘目标相关背景自查二、分析方法与过程 1、EDA（探索性数据分析） 1.分布分析 2.周期性分析 2、数据预处理 1.数据清洗过滤非居民用电数据，过滤节假日用电数据（节假日用电量明显低于工作日） 2.缺失值处理 3.数据变换以线损指标为例，可自定义为通过这种方式，将上面各种复杂 ...

分类：编程语言时间：2019-03-01 12:54:38 阅读次数：389

共368条上一页 1 ... 14 15 16 17 18 ... 37 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)