离散特征编码分两种,特征具有大小意义,特征不具有大小意义。 1、特征不具备大小意义的直接独热编码 2、特征有大小意义的采用映射编码 [python] view plain copy import pandas as pd df = pd.DataFrame([ ['green', 'M', 10.1 ...
分类:
编程语言 时间:
2018-05-08 23:52:05
阅读次数:
308
win不愧是最烂的开发平台,在安装第三方模块时经常出现些幺蛾子。 今天在window中使用python3自带的pip安装scrapy时,出错,错误代码如下: 1 关键词是:failed with error code 1 事实上,这个错误码之前在安装pandas时也出现过,当时不了了之了。 现今推测 ...
panddas 读入 csv 文件¶ In [9]: import pandas as pd f = open('D:/Project/180414山东癌症交接/初始数据/1973to2015.csv') all_data = pd.read_csv(f) In [30]: df2014 = all ...
分类:
其他好文 时间:
2018-05-07 22:57:09
阅读次数:
223
python数据分析工具pandas中DataFrame和Series作为主要的数据结构. 本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数。 1)查看DataFrame数据及属性 2)使用DataFrame选择数据: 3)使用DataFrame重置数据: 4)使用Dat ...
分类:
其他好文 时间:
2018-05-07 14:48:09
阅读次数:
170
最近无聊,想玩玩数据挖掘,就拿天池的天池新人实战赛之[离线赛]练练手。https://tianchi.aliyun.com/getStart/information.htm?spm=5176.100067.5678.2.2b282b2bAOqNmy&raceId=231522 其中在处理数据时,我需 ...
分类:
其他好文 时间:
2018-05-06 22:53:53
阅读次数:
567
1)仅换掉index名称 df.index = list 2)调整index时,后面的项目也要跟着调整: df.reindex(list) 注意如果list中出现了df中没有的index,后面的项目会变成nan 举例: df=pd.DataFrame({'a':[1,2,3],'b':[4,5,6] ...
分类:
其他好文 时间:
2018-05-06 17:03:39
阅读次数:
5727
pandas时间: p1=pd.Timestamp(2018,2,3) p1输出:2018-02-03 00:00:00 p1输出类型:<class 'pandas._libs.tslib.Timestamp'> pandas时间转到时间戳: pd.Timestamp.timestamp(p1) 备 ...
分类:
其他好文 时间:
2018-05-06 17:00:18
阅读次数:
1339
Mysql表数据: demo.sql内容 实现效果如下: Python代码: 1 import pymysql 2 import pandas as pd 3 import plotly.plotly 4 import plotly.graph_objs as pg 5 6 7 def bar_ch ...
分类:
数据库 时间:
2018-05-06 16:22:01
阅读次数:
487
#中文myfont = FontProperties(fname=r'C:\Windows\Fonts\simhei.ttf', size=14)import seaborn as snssns.set(font=myfont.get_name())file = open(".xlsx", "rb" ...
分类:
其他好文 时间:
2018-05-03 11:38:38
阅读次数:
285
本文是Python大数据与机器学习系列文章中的第6篇,将介绍学习Python大数据与机器学习所必须的NumPy库。 通过本文系列文章您将能够学到的知识如下: 应用Python进行大数据与机器学习 应用Spark进行大数据分析 实现机器学习算法 学习使用NumPy库处理数值数据 学习使用Pandas库 ...
分类:
编程语言 时间:
2018-05-02 15:50:11
阅读次数:
236