Logistic 回归通常是二元分类器(也可以用于多元分类),例如以下的分类问题Email: spam / not spamTumor: Malignant / benign假设 (Hypothesis):$$h_\theta(x) = g(\theta^Tx)$$ $$g(z) = \frac{1...
分类:
其他好文 时间:
2015-12-22 01:09:20
阅读次数:
393
分类 问题1.什么是分类? 就是把一个类的功能,分出一部分来放在一个独立的文件中2.分类的语法是什么样的?@interface Person(SuperMan)3.分类与类是什么关系? 分类依赖类而存在,没有类也就没有分类4.分类有什么作用?用于把一个比较庞大的类,分割开来,具有相同功能的方法放到一...
分类:
其他好文 时间:
2015-12-15 21:18:00
阅读次数:
173
原文:http://blog.sina.com.cn/s/blog_818f5fde0102vxf7.html之前实习,公司团队用LR进行推荐排序的时候,都会将所有特征离散成非常高维的0/1特征(千万维级别),然后再进行模型训练。大牛说这样可以解决模型的非线性问题。因为逻辑回归只能拟合线性分类问题,...
分类:
其他好文 时间:
2015-12-11 12:51:52
阅读次数:
242
第二章:User Guide Supervised learning1 一般的线性模型下面的一些方法是用来处理输入变量和目标值之间具有线性关系的回归问题。以数学上的观念来看,如果是预测值,那么在这个公式中,我们抽象出向量作为coef_,而作为intercept_如果想使用一般的线性模型来处理分类问题...
分类:
其他好文 时间:
2015-12-10 21:55:15
阅读次数:
198
提升方法(boosting)是一种常用的统计学习方法,应用广泛且有效。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。 本章首先介绍提升方法的思路和代表性的提升算法AdaBoost,然后通过训练误差分析探讨AdaBoost为什么能够提高学习精度,....
分类:
其他好文 时间:
2015-12-04 14:45:46
阅读次数:
287
两种分类问题: binary & multi-class下面的是两种类型的分类问题(一种是binary classification,一种是multi-class classification)如果是binary classification的分类问题,则output layer只有一个结点(1 o...
分类:
其他好文 时间:
2015-11-30 22:08:46
阅读次数:
223
原文:http://closure.blog.ustc.edu.cn/?p=117阿里这次天猫推荐算法大赛题目的核心是给定用户对品牌的四个月的操作记录,预测下个月哪些用户对哪些品牌产生购买行为,这可以抽象为一个01分类问题,更确切的可以抽象为一个点击率预估(CTR)。与其说这是一次比赛,我觉得更多的...
分类:
编程语言 时间:
2015-11-30 20:28:40
阅读次数:
513
目前看到的比较全面的分类算法,总结的还不错. 主要分类方法介绍解决分类问题的方法很多[40-42] ,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等;另外还有用于组合单一分类方法的集成学习算法,如Bagging和Boosting等。 (1...
分类:
编程语言 时间:
2015-11-28 20:03:30
阅读次数:
186
上次提到的手写数字的识别就是一个多分类的问题,有10种不同的分类(0-9)。在神经网络中我们所做的多分类问题是the one VS all方法的延伸,让我们看一个computer vision的例子,在这个例子中,我们要对图片进行4个分类:步行,car,摩托车,火车。我们建立的这个神经系统,它有4个...
分类:
其他好文 时间:
2015-11-26 00:59:36
阅读次数:
181
系列文章:《机器学习实战》学习笔记 决策树 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。 缺点:可能会产生过度匹配问题。 适用数据类型:离散型和连续型 我们经常使用决策树处理分类问题,它的过程类似二十个问题的游戏:参与游戏的一方在脑海里想某个事物,其他参与者...
分类:
其他好文 时间:
2015-11-13 06:14:05
阅读次数:
238