判断异常值方法:Z-Score 计算公式 Z = (X-μ)/σ 其中μ为总体平均值,X-μ为离均差,σ表示标准差。z的绝对值表示在标准差范围内的原始分数与总体均值之间的距离。当原始分数低于平均值时,z为负,以上为正。 代码演示 1 生成一个 df 1 import pandas as pd # 导 ...
分类:
其他好文 时间:
2020-02-27 13:15:49
阅读次数:
675
1 ##自选股(代码、日期)合并保存 2 import tushare as ts 3 import pandas as pd 4 ##输入自选股 5 data_list=['600850','603722','002411','002444','002456','300011'] 6 StockP ...
分类:
其他好文 时间:
2020-02-26 17:19:35
阅读次数:
79
最开始是将数据库数据写到本地excel中,再读出来返回给前端,后面发现可以使用BytesIO(),不用再使用本地文件 x_io = BytesIO() df = pd.DataFrame(list(res['data'])) df.to_excel(x_io, sheet_name=table_na ...
分类:
其他好文 时间:
2020-02-25 20:32:19
阅读次数:
170
一,源数据的载入 需求: 1. 按照班级筛选 2. 把筛选出来的数据分别保存在一个文件的各个sheet中 二,代码编写 1 import pandas as pd 2 import os 3 import time 4 import openpyxl 5 # 1.加载Excel源数据 6 path ...
分类:
编程语言 时间:
2020-02-25 16:13:07
阅读次数:
188
在使用 pd.scatter_matrix() 函数时会出现 module 'pandas' has no attribute 'scatter_matrix'错误 解决方法: 将代码改成: pd.plotting.scatter_matrix() 这个就可以显示出散点图矩阵了 完整代码: iris ...
分类:
其他好文 时间:
2020-02-24 21:04:59
阅读次数:
112
Pandas是为了解决数据分析任务而创建的,纳入了大量的库和标准数据模型,提供了高效地操作大型数据集所需的工具。 对于Pandas包,在Python中常见的导入方法如下: from pandas import Series,DataFrame import pandas as pd 首先,我们需要对 ...
分类:
其他好文 时间:
2020-02-23 22:02:23
阅读次数:
140
最近学习python数据分析,遇到了四分位数计算问题,因四分位数计算公式不一致,导致结果不一样,坑爹的百度只给了一种计算方法,容易迷惑初学者,故总结如下: 计算方法三个四分位数的确定:先按从小到大方法排序,然后使用下列方法。方法1:n+1法 Q1的位置= (n+1) × 0.25 Q2的位置= (n ...
分类:
其他好文 时间:
2020-02-23 20:35:47
阅读次数:
729
简介 Pandas [1] 是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工 ...
分类:
其他好文 时间:
2020-02-23 14:45:34
阅读次数:
61
python中常用的分析文档、计算词语相似度的包 —— Word2Vec函数;该函数在gensim.models.Word2Vec包内。 分析文本和计算相似度有几个步骤: 导入需要用到的库: # 导入第三包 import jieba import pandas as pd import gensim ...
分类:
其他好文 时间:
2020-02-22 16:05:44
阅读次数:
135
自2020年一月份以来,新冠病毒的爆发与治疗让我们每个人都不太舒服 虽然我们普通人能做的地方并不多,并不能像医护人员一样冲锋陷阵,但是我们只要听从命令与指挥,不给国家添乱,我们就已经为国家贡献出了属于自己的力量。 加油吧中国! 好了,言归正传,经过简单的爬虫学习,就想编写一个实时系统来查询确诊数据, ...
分类:
其他好文 时间:
2020-02-22 09:30:21
阅读次数:
108