LIME: 模型是否值得信任? 我们在建立模型的时候,经常会思考我们的模型是不是够稳定,会不会出现样本偏差效应, p>>N时候会不会过拟合? 我们检查模型稳定,我们进行一些cross-validation来看看各项评估指标方差大不大。 可是如果样本一开始因为采样偏差导致样本有偏,导致模型和实际情况有差异,这个就不太好评估了。同样,p>>N也会有类似的问题,尤其在文本挖掘领域。一般情况,如果特征不是很多的话,尤其像logistic regression这样的model,我们会把模型权重给打印出来看看,看看训...
分类:
其他好文 时间:
2016-04-11 12:27:20
阅读次数:
229
本文主要记录我在学习逻辑回归时的心得笔记,从假设函数、代价函数、优化方法等方面介绍了逻辑回归。...
分类:
其他好文 时间:
2016-04-10 14:52:08
阅读次数:
214
最近在Coursera上看吴大神的Machine Learning,感觉讲的真的很棒。所以觉得应该要好好做做笔记,一方面是加强自己对ML中一些方法的掌握程度和理解,另一方面也能方便自己或者同样爱好ML的同学。线性回归(Linear Regression) 线性回归(Linear Regression)应该是机器学习中最基本的东西了。所谓回归,想必大家在高中时期的课程里面就接触过,给定一系列离散的点...
分类:
其他好文 时间:
2016-04-10 14:50:43
阅读次数:
301
从 coursa 上面学的是说,监督学习是指我们来教计算机如何“学习”,非监督学习是指让计算机自己学习。监督学习又有两个大的分支,一个是 regression,另一个是 classification。 既然是我们来教计算机如何学习,那就必定有一个“标准答案”。regression 是说,这个标准答案 ...
分类:
系统相关 时间:
2016-04-10 10:13:28
阅读次数:
220
转载地址:http://blog.csdn.net/w28971023/article/details/8240756 GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树... ...
分类:
其他好文 时间:
2016-04-09 23:43:40
阅读次数:
540
这几天完成了树回归的相关学习,这一部分内容挺多,收获也挺多,刚刚终于完成了全部内容,非常开心。
树回归这一章涉及了CART,CART树称作(classify and regression tree) 分类与回归树,既可以用于分类,也可以用于回归。这正是前面决策树没有说到的内容,在这里补充一下。正好也总结一下我们学的3种决策树。
ID3:用信息增益来选择特性进行分类,只能处理分类问题。缺点是往往...
分类:
其他好文 时间:
2016-04-09 00:23:43
阅读次数:
323
theano logistic regression讲解逻辑模型是一个基于概率的线性分类器。它的参数是w和b。 通过把输入向量映射到一个超平面集合上来实现分类,每个超平面对应一个分类。从超平面到输入向量的距离反应了这个概率,就是说输入属于这个分类的概率。数学上,一个输入属于某个分类的公式可以表达为下面的公式:
这个公式的意思是,当已知一个输入x,根据猜想的参数(w,b)得到的softmax就是...
分类:
其他好文 时间:
2016-04-07 09:41:29
阅读次数:
274
从统计学的角度来看,机器学习大多的方法是统计学中分类与回归的方法向工程领域的推广。 “回归”(Regression)一词的滥觞是英国科学家Francis Galton(1822-1911)在1886年的论文[1]研究孩子身高与父母身高之间的关系。观察1087对夫妇后,得出成年儿子身高=33.73+0 ...
分类:
其他好文 时间:
2016-04-07 06:56:24
阅读次数:
199
Quantitative algorithm
Error evaluation
In this chapter, we review some of the key ideas underlying the linear regression model, as well as the least squares approach that is most commonly used to...
分类:
其他好文 时间:
2016-04-05 10:54:55
阅读次数:
342
逻辑回归、决策树和支持向量机 2015-12-03 CSDN大数据 CSDN大数据 分类问题是我们在各个行业的商业业务中遇到的主要问题之一。在本文中,我们将从众多技术中挑选出三种主要技术展开讨论,逻辑回归(Logistic Regression)、决策树(Decision Trees)和支持向量机( ...
分类:
其他好文 时间:
2016-04-04 16:34:46
阅读次数:
342