接着以前的《SAS编程与数据挖掘商业案例》,之前全是sas的基础知识,现在开始进入数据挖掘方面笔记,本文主要介绍数据挖掘基本流程以及应用方向,并以logistic回归为例说明。
一:数据挖掘综述
衡量一个数据挖掘模型价值的唯一标准就是商业目标,为达到一个商业目标,有很多种方法,只有高效解决商业目标的方法才是最牛的方法,即使是看似简单的方法,只要能高效解决商业目标,我们就认为是牛的方法;...
分类:
其他好文 时间:
2014-09-29 18:29:01
阅读次数:
397
由于最近在学习standford大学 Andrew Ng 大牛的机器学习视频,所以想对所学的方法做一个总结,后面所要讲到的算法主要是视频里面学到的机器学习领域常用的算法。在文中我们所要学的的算法主要有Linear Regression(线性回归),gradient descent(梯度下降法),n....
分类:
其他好文 时间:
2014-09-29 12:47:20
阅读次数:
254
由于最近在学习standford大学 Andrew Ng 大牛的机器学习视频,所以想对所学的方法做一个总结,后面所要讲到的算法主要是视频里面学到的机器学习领域常用的算法。在文中我们所要学的的算法主要有Linear Regression(线性回归),gradient descent(梯度下降法),no...
分类:
其他好文 时间:
2014-09-28 22:59:05
阅读次数:
234
一些常用的SAS命令
1. 转换文本数据文件的数据步的一般形式为:
data 数据集名;infile 文件名;
input 变量输入设定;
run;
2. 指定逻辑文件名语句的一般形式为:filename 逻辑文件名 ‘文件位置’;
3. 查看SAS逻辑库的属性和内容的一般写法为:proc datasets lib=逻辑库名;run;
4. 查看SAS数据集的属性的一般写法为:p...
分类:
其他好文 时间:
2014-09-28 10:32:41
阅读次数:
313
信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广义线性模型。
本文重点介绍模型变量WOE以及IV原理,为表述方便,本文将模型目标标量为1记为违约用户,对于目标变量为0记为正常用户;则WOE(weight
of Evidenc...
分类:
其他好文 时间:
2014-09-26 19:39:28
阅读次数:
430
分类回归树算法:CART(Classification And Regression Tree)算法采用一种二分递归分割的技术,将当前的样本集分为两个子样本集,使得生成的的每个非叶子节点都有两个分支。因此,CART算法生成的决策树是结构简洁的二叉树。
分类树两个基本思想:第一个是将训练样本进行递归地划分自变量空间进行建树的想法,第二个想法是用验证数据进行剪枝。
CART与C4.5的...
分类:
其他好文 时间:
2014-09-24 12:33:26
阅读次数:
230
This model generalizes logistic regression to classification problems where the class label y can take on more than two possible values. Softmax regre...
分类:
其他好文 时间:
2014-09-16 12:06:50
阅读次数:
891
上一节讲了logistic混沌模型,这一节对其扩充一下讲二维Logistic映射.它起着从一维到高维的衔接作用,对二维映射中混沌现象的研究有助于认识和预测更复杂的高维动力系统的性态。通过构造一次藕合和二次祸合的二维Logistic映射研究了二维Logistic映射通向混沌的道路,分析了其分形结...
分类:
其他好文 时间:
2014-09-15 14:14:59
阅读次数:
347
二类分类器svm 的loss function 是 hinge loss:L(y)=max(0,1-t*y),t=+1 or -1,是标签属性. 对线性svm,y=w*x+b,其中w为权重,b为偏置项,在实际优化中,w,b是待优化的未知,通过优化损失函数,使得loss function最小,得到优化...
分类:
其他好文 时间:
2014-09-15 14:08:08
阅读次数:
229
logistic回归又称logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率。相关DEMO参见:混沌数学之离散点集图形DEMOlogistic的用途: 一、寻找危险因素,正如上面所说的寻找某一疾病的危险因素等。 二、预测...
分类:
其他好文 时间:
2014-09-15 12:36:58
阅读次数:
233