training = pd.DataFrame({'x':[3,6,9,15,300, 20,85]}). 原始数据training_fitting = pd.DataFrame({'x':[4,7,8,30,280, 10,79]})。 原始数据的fitting值,方法不限。xgboost,RF。 ...
分类:
其他好文 时间:
2018-04-08 21:12:15
阅读次数:
172
针对Series对象,从中抽取信息 unique可以得到Series对象的唯一值数组 返回的是未排序的数组,如果需要排序,再次执行sort()方法或者用numpy的顶级函数sort() 值计数 用到value_counts方法或value_count顶级函数 isin用于判断矢量化集合的成员资格,可 ...
分类:
其他好文 时间:
2018-04-07 18:57:52
阅读次数:
193
写在前面: 由昨天的记录我们知道,用pandas.read_csv(“文件名”)的方法读取文件,返回的变量类型为DataFrame结构。也是pandas中最核心的一种类型。那在pandas中还有没有什么其他的类型啊,当然是有的啦,我们把DataFrame类型理解为是由行和列构成的数据,那么将Data ...
分类:
编程语言 时间:
2018-04-07 17:39:23
阅读次数:
250
reindex:重新索引 pandas对象有一个重要的方法reindex,作用:创建一个适应新索引的新对象 以Series为例 1 >>> series_obj = Series([4.5,1.3,5,-5.5],index=('a','b','c','d')) 2 >>> series_obj 3 ...
分类:
其他好文 时间:
2018-04-07 14:58:37
阅读次数:
252
参考这篇文章: https://blog.csdn.net/u012387178/article/details/52571725 python pandas判断缺失值一般采用 isnull(),然而生成的却是所有数据的true/false矩阵,对于庞大的数据dataframe,很难一眼看出来哪个数 ...
分类:
其他好文 时间:
2018-04-07 12:57:53
阅读次数:
722
欢迎来到Python for Finance教程系列的第7部分。 在之前的教程中,我们为整个标准普尔500强公司抓取了雅虎财经数据。 在本教程中,我们将把这些数据组合到一个DataFrame中。 到此为止的代码: 尽管我们掌握了所有数据,但我们可能想要一起评估数据。为此,我们将把所有的股票数据集合在 ...
分类:
编程语言 时间:
2018-04-06 12:28:00
阅读次数:
221
文本文件的内容: 由上述代码可以看出,KK是一个实体类型并且可序列化(Serializable)! ...
分类:
数据库 时间:
2018-04-04 16:15:24
阅读次数:
365
1)查看DataFrame数据及属性 1 2 3 4 5 6 7 8 9 10 11 2)使用DataFrame选择数据: 1 2 3 4 3)使用DataFrame重置数据: 1 4)使用DataFrame筛选数据(类似SQL中的WHERE): 1 2 3 5)使用DataFrame模糊筛选数据( ...
分类:
其他好文 时间:
2018-04-03 14:32:30
阅读次数:
159
dates=pd.date_range('20160728',periods=6) #创建固定频度的时间序列 df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) #创建6*4的随机数,索引,列名称。 df2=p ...
分类:
其他好文 时间:
2018-03-31 14:23:36
阅读次数:
207