来自:https://blog.csdn.net/xw_classmate/article/details/51333646 来自:https://blog.csdn.net/chenKFKevin/article/details/62049060 来自:https://blog.csdn.net/ ...
分类:
其他好文 时间:
2018-05-01 23:47:50
阅读次数:
265
更新至2018.5.1 字典生成DataFrame 今天一个字典生成一个DataFrame,采用了以下形式,每一个value都是一个数(不是vector) 结果爆出了如下错误 原来所以,将字典生成DataFrame,您可以用 ,当然也不一定非要这样,所以三种方法是可以成功的: 引自: "统计师的Py ...
分类:
其他好文 时间:
2018-05-01 12:29:54
阅读次数:
185
Python Data Analysis Library — pandas: Python Data Analysis Library https://pandas.pydata.org/ pandas is an open source, BSD-licensed library providin ...
分类:
编程语言 时间:
2018-05-01 12:21:00
阅读次数:
222
import requests, re, jieba,pandas from bs4 import BeautifulSoup from datetime import datetime from wordcloud import WordCloud import matplotlib.pyplot... ...
分类:
其他好文 时间:
2018-04-30 18:11:59
阅读次数:
163
导入包: 读入初始文本、停用词文件,创建保存初始分词数据的Dataframe 一些参数: 由于文件里文本内容比较多,直接读取、分词、过滤会比较慢,采用多线程按行读取并处理 单行处理函数: 使用多线程读取: 打印最初分词后的数据: 创建词汇-频数库: 创建词性-频数库: 统计几种重要词性的词汇分布: ...
分类:
其他好文 时间:
2018-04-30 15:42:14
阅读次数:
697
最近使用pandas,一直搞不清楚其中几种切片方法的区别,今天专门看了一下。 0. 把Series的行index或Dataframe的列名直接当做属性来索引。 如: 但是这种方法索引的名字可能会与自带的方法冲突,比如min,max等等,所以可能会失效。另外,在新版本中,这种索引方法不能作为左值。 1 ...
分类:
其他好文 时间:
2018-04-30 14:31:39
阅读次数:
340
Python Map Pythonic docopt pocoo Werkzeug click Flask RESTful Jinja2 RESTful Sphinx txt2tags AsciiDoc Pelican moinmoin Pygments Werkzeug click Flask R ...
分类:
编程语言 时间:
2018-04-30 11:56:41
阅读次数:
220
数据挖掘比赛中,获得的数据中可能有个人的生日,在数据分析中并不需要生日,而是需要年龄。不同年龄会呈现不同的状态,比如收入、健康、居住条件等,年龄能够很好的把不同样本的差异性进行大范围的划分。下面讲述如果将生日转年龄: # -*- coding: utf-8 -*- # 生成数据 import pan... ...
分类:
其他好文 时间:
2018-04-29 16:22:43
阅读次数:
580
标准时间格式:2012-12-21 时间转换函数:pandas.to_datatime() # -*- coding: utf-8 -*- # 生成数据 import pandas as pd data = {'birth':['2011/12/01','2012/12/02','2012/12/0... ...
分类:
其他好文 时间:
2018-04-29 15:23:21
阅读次数:
1728
pandas简介 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。 Series:一维数组,与Numpy中的一维arr ...
分类:
其他好文 时间:
2018-04-29 01:25:48
阅读次数:
1102