如何进行金融行业数据分析与建模,是挖掘金融行业数据价值的重要手段。金融行业数据分析与建模方法主要包括七个重要环节,每个环节紧密相连。本文从中国农业银行“雅典娜杯”数据挖掘大赛看金融行业数据分析与建模方法。本文结合了博主、内部赛优秀团队以及外部赛冠/亚/季军的方案分享!赛题名称:贷款风险预测;问题描述... ...
分类:
其他好文 时间:
2020-05-10 01:01:50
阅读次数:
154
Cookies是存储在客户机的文本文件,它们保存了大量轨迹信息。在servlet技术基础上,JSP显然能够提供对HTTP cookies的支持。 通常有三个步骤来识别回头客: 服务器脚本发送一系列cookies至浏览器。比如名字,年龄,ID号码等等。 浏览器在本地机中存储这些信息,以备不时之需。 当 ...
分类:
Web程序 时间:
2020-05-09 17:14:33
阅读次数:
66
ZABBIX结合自动发现机制实现站点/hs页面健康监控需求:为了防止业务假死,我们需要对服务hs页面进行监控前提:项目标准化程序较高,已经规划/hs页面的使用说明:ZABBIX本身也有web监控项,但是不够灵活,每次配置一个域名都需要一连串配置才可以,在微服务站点多切变化频繁时管理将会十分低效通过自动发现监控的逻辑:1、zabbix通过脚本或者其他形式首先发现识别json域名列表进行引用2、当za
分类:
其他好文 时间:
2020-05-09 10:37:22
阅读次数:
108
链接:https://pan.baidu.com/s/1inc53wfbJ_6dOKWp2LbGDA 提取码:gwy0 这本书和上学的时候学的数据挖掘导论有点像,很经典的一本书,伴我一点点熟悉了这个领域 ...
分类:
其他好文 时间:
2020-05-09 00:45:04
阅读次数:
67
Pandas详解 Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。 1、安装包 pip install pandas 2、数据结构 Pandas有三大数据结构,Series、DataFrame以及Pan ...
分类:
其他好文 时间:
2020-05-09 00:32:44
阅读次数:
78
链接:https://pan.baidu.com/s/1_ytY_EEBzb3uqmtcl1Ku1Q 提取码:97em 这本书是我研一学习数据挖掘课程的教材,很经典,书也比较厚,讲的比较透彻 链接:https://pan.baidu.com/s/1_ytY_EEBzb3uqmtcl1Ku1Q 提取码 ...
分类:
其他好文 时间:
2020-05-09 00:27:53
阅读次数:
84
redash可以作为可视化工具、数据库查询编辑器(类似navicat-premium)、数据挖掘探索工具来用。截止目前,自建redash支持43种数据源,在权限控制,精细配图方面比superset弱,但是环境易维护,可以生成中间表,可以join。 权限管理 https://ithelp.ithome ...
分类:
其他好文 时间:
2020-05-06 14:16:51
阅读次数:
233
数据采集利用各种手段获取数据,数据样式不限制,但一般而言是形如excel或者csv这样的表格格式。数据采集:urllib,requests数据解析:Xpath,BS4,正则表达式数据持久化存储:pd.to_csv,pd.to_excel,MySQL,Redis数据预处理一般而言,数据分析和数据挖掘领域的处理的数据都是海量的数据,这样的数据难免会出现问题。数据预处理占到数据挖掘工作的60%,这是最重
分类:
编程语言 时间:
2020-05-03 00:58:59
阅读次数:
67
序言 众所周知,大多数情况下,业务需要记录的并不是简单的系统时间%date,级别%level,信息%message等字段,而是需要自定义的业务字段。以便后续的数据挖掘和钻取。 逐步研究发现Log4Net记录日志的info,error,debug等方法可以传入object参数:log.info(obj ...
分类:
Web程序 时间:
2020-05-02 22:54:28
阅读次数:
87
TF IDF基础: TF IDF(Term Frequency InversDocument Frequency)是一种常用于信息处理和数据挖掘的加权技术。该技术采用一种统计方法,根据字词的在文本中出现的次数和在整个语料中出现的文档频率来计算一个字词在整个语料中的重要程度。它的优点是能过滤掉一些常见 ...
分类:
其他好文 时间:
2020-04-30 12:01:23
阅读次数:
88