入门机器学习时,一些测试数据是网络上的csv文件。这里总结了两种加载csv文件的方式: 1 通过numpy、urllib2加载 2 通过pandas加载 3 总结 np.loadtxt返回的数据类型是:numpy.ndarray pd.read_csv返回的数据类型是:pandas.core.fra ...
分类:
编程语言 时间:
2017-01-15 10:40:02
阅读次数:
428
常用Python机器学习包 Numpy:用于科学计算的包 Pandas:提供高性能,易于使用的数据结构和数据分析工具 Scipy:用于数学,科学工程的软件 StatsModels:用于探索数据、估计统计模型、统计检验 Scikit-learn:提供经典的机器学习算法用于数据挖掘和数据分析 matpl ...
分类:
编程语言 时间:
2017-01-14 13:39:40
阅读次数:
237
pandas选取数据iloc和loc的用法不太一样,iloc是根据索引,loc是根据行的数值>>>importpandasaspd
>>>importos
>>>os.chdir("D:\\")
>>>d=pd.read_csv("GWAS_water.qassoc",delimiter="\s+")
>>>d.loc[1:3]
CHRSNPBPNMISSBETASER..
分类:
编程语言 时间:
2017-01-14 00:38:15
阅读次数:
4707
转自:https://sanwen8.cn/p/2241oUa.html shift函数是对数据进行移动的操作,假如现在有一个DataFrame数据df,如下所示: 那么如果执行以下代码: 就会变成如下: 看一下函数原型: 参数 periods:类型为int,表示移动的幅度,可以是正数,也可以是负数 ...
分类:
其他好文 时间:
2017-01-13 20:46:52
阅读次数:
943
df['cum_sum'] = df.val1.cumsum() df['cum_perc'] = 100*df.cum_sum/df.val1.sum() ...
分类:
其他好文 时间:
2017-01-10 11:40:45
阅读次数:
191
1、numpy:基础模块,高效处理数据、提供数组支持 2、pandas:数据探索和数据分析 3、matplotlib:数据成图模块,解决数据可视化 4、scipy:支持数值计算,支持矩阵运算,提供高等数学处理:积分、傅立叶变换、微分方程求解 5、statsmodels:统计分析 6、gensim:文 ...
分类:
编程语言 时间:
2017-01-09 21:44:37
阅读次数:
203
背景:本文类似文章的目录部分,以系统学习python 新知识和复习总结用 python 基本语法 numpy库 matplotlib绘图库 pandas库 scikit-learn 机器学习库 ...
分类:
编程语言 时间:
2017-01-01 20:39:02
阅读次数:
259
# -*- coding: utf-8 -*- import os import pandas as pd # ========== 遍历数据文件夹中所有股票文件的文件名,得到股票代码列表stock_code_list stock_code_list = [] for root, dirs, fil... ...
分类:
其他好文 时间:
2017-01-01 14:13:49
阅读次数:
250
在我本地Mysql_local_db数据库建立了一个pandas数据表用来对pandas模块的学习 1、创建表 2、Kettle导入测试数据 对数据进行了处理 3、执行SQL查询数据 4、Pycharm中编写代码 用pandas模块进行连接MySQL数据库 numpy 模块进行创建数组 matplo ...
分类:
数据库 时间:
2016-12-30 01:30:18
阅读次数:
313