码迷,mamicode.com
首页 > 编程语言 > 详细

Python大数据:信用卡逾期分析

时间:2018-03-20 22:08:35      阅读:531      评论:0      收藏:0      [点我收藏+]

标签:plt   col   python   plot   相关性   信用卡   enc   res   infer   

# -*- coding:utf-8 -*-
# 数据集成

import csv
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt  

#客户信息
basicInfo = pd.DataFrame.from_csv(datas/basicInfo_train.csv, header=0, sep=,, index_col=0, parse_dates=True, encoding=None, tupleize_cols=False, infer_datetime_format=False)
#历史还款记录
historyInfo = pd.DataFrame.from_csv(datas/history_train.csv, header=0, sep=,, index_col=0, parse_dates=True, encoding=None, tupleize_cols=False, infer_datetime_format=False)
#历史逾期情况
defaultInfo = pd.DataFrame.from_csv(datas/default_train.csv, header=0, sep=,, index_col=0, parse_dates=True, encoding=None, tupleize_cols=False, infer_datetime_format=False)
combineInfo = pd.concat([basicInfo,historyInfo,defaultInfo],axis=1)
#查看前10条数据
combineInfo[:10]
#性别分析
gender = combineInfo.groupby(SEX)[Default].mean().reset_index()
plt.xticks((0,1),(u"Male",u"Female"))
plt.xlabel(u"Gender")
plt.ylabel(u"Counts")
plt.bar(gender.SEX,gender.Default,0.1,color=green)
plt.show()
#教育程度与default值的相关性分析
edu = combineInfo.groupby(EDUCATION)[Default].mean()
plt.plot(edu)
plt.show()
#婚姻状况分析
marriage = combineInfo.groupby(MARRIAGE)[Default].mean().reset_index()
plt.bar(marriage.MARRIAGE,marriage.Default,0.5,color=green)
plt.show()

 

Python大数据:信用卡逾期分析

标签:plt   col   python   plot   相关性   信用卡   enc   res   infer   

原文地址:https://www.cnblogs.com/blackice/p/8613012.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!