码迷,mamicode.com
首页 > 其他好文 > 详细

DataFrame的groupby()

时间:2020-06-16 14:52:10      阅读:72      评论:0      收藏:0      [点我收藏+]

标签:uri   python   取出   构建   ima   计算   metrics   false   app   

 

有这样一张表,“non_response_num”是真实非应答次数,“predict_non_response_num”是模型预测的非应答次数。

 

技术图片

 

 

 

想计算每个时间片内不同group_id的所有hex_center的MAE值,用groupby方法:

from sklearn import metrics

merge_df.groupby([‘time_slot‘, ‘booking_groupid‘]) \
      .apply(lambda x: metrics.mean_absolute_error(x.non_response_num, x.predict_non_response_num)) \
      .reset_index(name=‘MAE‘)

 

groupby后加apply,lambda匿名函数中x表示当前聚到一起的行,利用sklearn计算MAE的值。

这里groupby返回的结果是series,keys为‘time_slot‘, ‘booking_groupid‘ ,values为计算得出的MAE

想将此series转换成dataframe,有三种方法:

1、在apply()之后用.reset_index()方法,参数name是列名

2、用.to_frame()方法

3、将series的key和value取出,构建新的frame

dict = {‘index‘:test_series.keys, ‘MAE‘:test_series.values}
df = pd.DataFrame(dict)

  

第一种方法得到结果

技术图片

 

 

 

技术图片

 

DataFrame的groupby()

标签:uri   python   取出   构建   ima   计算   metrics   false   app   

原文地址:https://www.cnblogs.com/4PrivetDrive/p/13140753.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!