#这里的结果返回最小日期,最大日期,但是没有指定列名,所以后面的书写形式返回的结果也不一样 grouped=df.groupby(by=['userid']).orderdate.agg(['min','max']) a=type(grouped['min']==grouped['max']) b= ...
                            
                            
                                分类:
其他好文   时间:
2020-01-03 00:52:57   
                                阅读次数:
126
                             
                         
                    
                        
                            
                            
                                    grouped=df.groupby(by=['userid']).min() 这句代码的运行结果是,按userid分组后,各userid下对应各字段的最小值, 使用上述代码后,返回的结果是 后面四个字段的值,并不对应上面的一条记录,返回的是每个字段的最小值,然后把各字段的最小值组合起来,返回给这个 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-03 00:27:52   
                                阅读次数:
71
                             
                         
                    
                        
                            
                            
                                    inplace=True :是指重置索引的结果是否作用在前面的数据上 我们并不能设置df.pivot_table(values='orderamount',index='month',aggfunc=sum) 输出结果的格式,所以在 df.pivot_table(values='orderamoun ...
                            
                            
                                分类:
其他好文   时间:
2020-01-01 17:17:53   
                                阅读次数:
641
                             
                         
                    
                        
                            
                            
                                import pandas as pdimport numpy as npdate = pd.date_range('20191231', periods=6)df = pd.DataFrame(np.arange(24).reshape(6,4), index=date, columns=['A' ...
                            
                            
                                分类:
编程语言   时间:
2019-12-31 18:24:23   
                                阅读次数:
116
                             
                         
                    
                        
                            
                            
                                    读取CSV 读取CSV文件时,,设置sep参数,可以替换分割用的符号: df = pd.read_csv('student_scores.csv', sep=':') df.head() 这样可以把冒号作为分隔符。 read_csv 的另一个功能是指定文件的哪一行作为标题,而标题指定了列标签。通常第 ...
                            
                            
                                分类:
其他好文   时间:
2019-12-31 14:09:40   
                                阅读次数:
83
                             
                         
                    
                        
                            
                            
                                    1 import pandas as pd 2 3 # 创建一个df 4 df = pd.DataFrame( 5 data={ 6 "name": ["zs", "ls", "ww", "zl"], 7 "age": [18, 19, 29, 11], 8 "score": [92.5, 93,  ...
                            
                            
                                分类:
其他好文   时间:
2019-12-29 20:50:07   
                                阅读次数:
85
                             
                         
                    
                        
                            
                            
                                    1. 查 1.1 行元素查询操作 像SQL那样打印列表前20元素,show函数内可用int类型指定要打印的行数: df.show() df.show(30) 以树的形式打印概要: df.printSchema() 获取头几行到本地: list = df.head(3) # Example: [Row ...
                            
                            
                                分类:
其他好文   时间:
2019-12-29 18:39:19   
                                阅读次数:
73
                             
                         
                    
                        
                            
                            
                                    通配符 * 来代表每个目录。 与 df 不一样的是,du 这个命令其实会直接到文件系统内去搜寻所有的文件数据。 ...
                            
                            
                                分类:
系统相关   时间:
2019-12-28 09:59:03   
                                阅读次数:
100
                             
                         
                    
                        
                            
                            
                                练习造轮子,新建一个属于自己的MyString类 首先来开启检测内存泄漏的函数 在main里添加 _CrtSetDbgFlag(_CrtSetDbgFlag(_CRTDBG_REPORT_FLAG) | _CRTDBG_LEAK_CHECK_DF); 开启内存泄漏检测 int main() { _C ...
                            
                            
                                分类:
其他好文   时间:
2019-12-27 18:11:11   
                                阅读次数:
77
                             
                         
                    
                        
                            
                            
                                昨日web测试环境登录白屏,慌忙登上机器查看,半天没找到问题。 不知哪根筋不对,df -h 一看 , /dev/sda1 已经100%。 立马 du -sh *,发现log日志有点大。 手工清理后,业务恢复。 当然,这只是开始。考虑到后续免维护,还是搞个crontab来处理。 查了下,可以一行命令搞 ...
                            
                            
                                分类:
系统相关   时间:
2019-12-27 13:44:30   
                                阅读次数:
112