#coding=utf8 import numpy as np import pandas as pd import re from gensim import corpora, models, similarities import gensim from nltk.corpus import s... ...
分类:
其他好文 时间:
2017-10-18 20:54:03
阅读次数:
292
pandas的两个主要数据对象:Series,DataFrame Series:是一种类似于以为数组的对象,它由一组数据(各种numpy数据类型)以及一组与之相关的数据标签组成。 仅由一组数据即可产生最简单的Series,并且会自动产生索引: 可以通过Series的values和index分别获取数 ...
分类:
其他好文 时间:
2017-10-17 19:57:44
阅读次数:
178
参考链接:http://www.python(tab).com/html/2017/pythonhexinbiancheng_0904/1170.html(去除括号) http://blog.csdn.net/eastmount/article/details/51082253 首先本文参考了上述两 ...
分类:
Web程序 时间:
2017-10-17 12:08:35
阅读次数:
247
pandas对象中的数据可以通过一些内置的方法进行合并:pandas.merge,pandas.concat,实例方法join,combine_first,它们的使用对象和效果都是不同的,下面进行区分和比较。 数据的合并可以在列方向和行方向上进行,即下图所示的两种方式: pandas.merge和实 ...
分类:
其他好文 时间:
2017-10-15 19:51:47
阅读次数:
522
在用pandas进行数据重排时,经常用到stack和unstack两个函数。stack的意思是堆叠,堆积,unstack即“不要堆叠”,我对两个函数这样理解和区分的。 常见的数据的层次化结构有两种,一种是表格,一种是“花括号”,即下面这样的l两种形式: store1 store2 store3 st ...
分类:
其他好文 时间:
2017-10-13 22:22:42
阅读次数:
495
import re import time from pprint import pprint import pandas as pd import requests class Snowball: xq = 'https://xueqiu.com' # 雪球自选股列表相关json url = {'... ...
分类:
其他好文 时间:
2017-10-12 14:59:50
阅读次数:
527
#构造一行数据>>> s = pd.Series([1,3,6,np.nan,44,1])>>> s0 1.01 3.02 6.03 NaN4 44.05 1.0dtype: float64 #创建一个索引列>>> dates = pd.date_range('20160101',periods=6 ...
分类:
其他好文 时间:
2017-10-11 14:12:19
阅读次数:
206
PS:本博文摘抄自中国慕课大学上的课程《Python数据分析与展示》,推荐刚入门的同学去学习,这是非常好的入门视频。 Numpy是科学计算库,是一个强大的N维数组对象ndarray,是广播功能函数。其整合C/C++.fortran代码的工具 ,更是Scipy、Pandas等的基础 .ndim :维度 ...
分类:
编程语言 时间:
2017-10-09 20:59:43
阅读次数:
235
# -*- coding: utf-8 -*- """ Created on Mon Oct 9 14:05:41 2017 @author: lenovo """ import numpy as np import pandas as pd #载入数据,合并测试集和训练集做特征处理 data_tr... ...
分类:
其他好文 时间:
2017-10-09 17:42:21
阅读次数:
336
输出: <class 'numpy.ndarray'><class 'pandas.core.frame.DataFrame'><class 'pandas.core.frame.DataFrame'> userRatingMat=pd.read_csv('./data/userRatingTabl ...
分类:
其他好文 时间:
2017-10-07 16:14:42
阅读次数:
336