按老师给的代码第一次提交得分 下面进行改进 一, 首先进行数据的清洗 先观察数据,首选'Pclass','Sex','Age'作为是否生还(Survived)的 考虑条件来建模 “Sex”的数值是字符型,于是用特征编码将性别用0,1表示 随后发现”Age”中有缺少值,由于age是数值量,可以直接使用 ...
分类:
其他好文 时间:
2020-02-13 19:06:55
阅读次数:
94
1. pandas概述 Numpy主要处理结构化数据,数据量比较小,规则 对于大量数据, 需要清理的数据,则需要pandas 一般使用方法是 import pandas as pd 2. pandas简单使用 本章主要介绍pandas三大件: Series DataFrame Index 2.1 p ...
分类:
其他好文 时间:
2020-02-13 15:16:30
阅读次数:
108
1. 数据科学领域中常用的python库 Numpy库:数据运算的基础库,运行效率高(底层C语言,高效index) Scipy库:实现了常用的科学计算方法(线性代数,傅里叶变换,信号和图像处理) Pandas库:分析数据的利器,高级数据结构(Series,DataFrame) Matplotlib库 ...
分类:
编程语言 时间:
2020-02-12 19:04:47
阅读次数:
101
From: KU Leuven; ESAT-STADIUS比利时鲁汶大学 ?? How to model real-world multidimensional time series? especially, when these are sporadically observed data. ? ...
分类:
其他好文 时间:
2020-02-12 00:56:56
阅读次数:
82
Pandas主要有两种数据结构:Series和DataFrame。 (1)Series:类似于一维数组的对象,由数据(各种NumPy数据类型)以及与之相关标签(索引)组成。仅由一组数据也可产生简单的Series对象。注意:Series中的索引值是可以重复的。 (2)DataFrame:表格型的数据结 ...
分类:
其他好文 时间:
2020-02-10 22:54:40
阅读次数:
134
pandas使用小贴士 1 通过Series创建DataFrame 在pandas系列的第一篇博文中曾提到,Series可视为DataFrame的一种特例,即只有一列数据。既然如此,是否可以并列多个Series组成一个DataFrame呢?当然可以,通过这种方式创建DataFrame也称为用字典建立 ...
分类:
编程语言 时间:
2020-02-08 13:24:15
阅读次数:
47
pandas作为python进行数据分析的常用第三方库,它是基于numpy创建的,使得运用numpy的程序也能更好地使用pandas。 1 pandas数据结构 1.1 Series 注:由于pandas与numpy关系密切,所以在代码中经常将二者一同导入使用。 上图中,先利用numpy创建一个一维 ...
分类:
编程语言 时间:
2020-02-07 13:14:56
阅读次数:
115
Problem: time series clustering TSC - unsupervised learning/ category information is not available. time-series clustering for anomaly detection/ patt ...
分类:
其他好文 时间:
2020-02-07 00:50:57
阅读次数:
99
时间序列(time series)数据是一种重要得结构化数据形式,在多个时间点观察或测量到得任何事物都可以形成一段时间序列,很多时间序列是固定频率的。也就是说,数据点是根据某种规律定期出现的(比如15s、5min、1mont)。时间序列也可以是不定期的。时间序列的意义取决于具体的应用场景,主要有以下 ...
分类:
其他好文 时间:
2020-02-06 14:52:29
阅读次数:
104
环境搭建 big data env setup 读写ES spark 怎么读写 elasticsearch Spark 上time series 处理 Flint by Two Sigma ...
分类:
其他好文 时间:
2020-02-06 14:39:30
阅读次数:
66