继续读书笔记,本次重点sas sql语句,由于sql内容多且复杂,本文只介绍商业应用中常用的并且容易出错的地方,内容包括:单表操作、多表关联、子查询以及merge和join的区别
1.单表操作
eg1:
Proc sql outobs=10; *可选项,功能类似于data步中的obs数据集选项
create table class as
Select...
分类:
其他好文 时间:
2014-09-29 19:02:11
阅读次数:
327
接着以前的《SAS编程与数据挖掘商业案例》,之前全是sas的基础知识,现在开始进入数据挖掘方面笔记,本文主要介绍数据挖掘基本流程以及应用方向,并以logistic回归为例说明。
一:数据挖掘综述
衡量一个数据挖掘模型价值的唯一标准就是商业目标,为达到一个商业目标,有很多种方法,只有高效解决商业目标的方法才是最牛的方法,即使是看似简单的方法,只要能高效解决商业目标,我们就认为是牛的方法;...
分类:
其他好文 时间:
2014-09-29 18:29:01
阅读次数:
397
继续《SAS编程与数据挖掘商业案例》读书笔记,本次重点:输出控制
主要内容包括:log窗口输出控制、output窗口输出控制、ods输出控制
1.log窗口输出控制
将日志输出到外部文件
proc printto log= "f:\data_model\book_data\chapt9\newlog.txt"; new;
proc print data=sashelp...
分类:
其他好文 时间:
2014-09-29 17:56:21
阅读次数:
277
《SAS编程与数据挖掘商业案例》学习笔记,本次重点:sas宏变量
内容包括:宏变量、宏函数、宏参数、通配函数、字符函数、计算函数、引用函数、宏语句、宏应用
1.宏触发器:
%name-token:是一个宏语句或宏函数
&name-token:是一个宏变量引用
宏变量不依赖于sas数据集,可以在任何一个除数据行以外的地方定义和引用宏变量,一般定义的宏变量为局部变量,除非...
分类:
其他好文 时间:
2014-09-29 17:55:51
阅读次数:
201
继续读书笔记,本文重点侧重sas观测值的操作方面, 主要包括:输出观测值、更新观测值、删除观测值、停止输出观测值等
1.output语句 输出当前在pdv中的观测值,继续无条件执行下面的语句。
注意:简单的data步不需要output语句,run语句会自动输出pdv中的数据到数据集,并返回data步开头继续执行下一条观测。
在有output语句和run语句同时存在时,pdv只...
分类:
其他好文 时间:
2014-09-28 11:05:51
阅读次数:
292
本次重点:data步循环与控制
涉及:if/then/else语句,select语句,do语句,continue语句,leave语句
1.if then else 语句
高效率的if应用:
1)
If x=1 then y=1;
Else if x=2 then y=2;
Else y=3;
对于每一个数据集的观测,if-then-else只会判...
分类:
其他好文 时间:
2014-09-28 10:49:01
阅读次数:
265
本次重点在:sas数据集管理
主要包括:包括数据集纵向拼接、转置、排序、比较、复制、重命名、删除等
1.append语句
注:base数据集和data两个数据集必须结构一样,避免使用force的情况,重复append的会造成重复。
一个避免重复的商业化应用:
%macro dl;
%if %sysfunc(exist(null)) ne 0 %then %...
分类:
其他好文 时间:
2014-09-28 10:32:11
阅读次数:
309
继续之前的读书笔记,本次讲解sas主要的变量操作,包括基本赋值语句、累加语句、keep语句、retain语句、array语句、rename语句、length语句。
1.基本赋值语句
z=x y;
z=sum(x,y); sum函数的好处是可以克服缺失值的影响;
2.如果表达式中既有数值型变量又有字符型变量的话,则会将字符型变量转化为数值型变量
...
分类:
其他好文 时间:
2014-09-26 11:18:31
阅读次数:
295
继续之前的读书笔记,废话少说,直奔主题。
本文重点在infile语句。
十一:infile语句
Dsd 规定一个数据集可以包含分隔符,但是要用引号括起来,两个连续分隔符之间的数作为缺失值处理, 默认分隔符为逗号
Firstobs= 规定从该记录行开始读入
Obs= 规定要读入的记录数
Length= virable 把当前行的数据长度赋值给临时...
分类:
其他好文 时间:
2014-09-26 10:11:53
阅读次数:
172
十:file语句
file中的option选项:
Dlm= 指定列表输出文件的分隔符,默认是空格
Dropover 规定当输出数据行长度超过指定值时,忽略超出部分
Flowover 规定当输出数据行长度超过指定值时,超过部分在下一行输出
Dsd 规定一个数据项可以包含分隔符,但是要用引号括住 默认分隔符是逗号
En...
分类:
其他好文 时间:
2014-09-25 20:23:51
阅读次数:
256