原文出处: 不会停的蜗牛 通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。 今天的算法如下: ...
分类:
编程语言 时间:
2018-07-20 11:16:55
阅读次数:
156
No.1. 线性回归算法的特点 No.2. 分类问题与回归问题的区别 上图中,左侧为分类问题,右侧为回归问题。左侧图中,横轴和纵轴表示的都是样本的特征,用不同的颜色来作为输出标记,表示不同的种类;左侧图中,只有横轴表示的是样本特征,纵轴用来作为输出标记,这是因为回归问题所预测的是一个连续的数值,无法 ...
分类:
其他好文 时间:
2018-07-19 17:32:49
阅读次数:
1194
一,scikit-learn中常用的评估模型 1.评估分类模型: ? 2.评估回归模型: ? 二、常见模型评估解析: ?对于二分类问题,可将样例根据其真实类别和分类器预测类别划分为:(T,F表示预测的正确与错误性,P,N表示预测的正类和负类) ?真正例(TruePositive,TP):真实类别为正 ...
分类:
其他好文 时间:
2018-07-19 13:55:00
阅读次数:
166
逻辑回归的基本过程:a建立回归或者分类模型 >b 建立代价函数 > c 优化方法迭代求出最优的模型参数 >d 验证求解模型的好坏。 1.逻辑回归模型: 逻辑回归(Logistic Regression):既可以看做是回归算法,也可以看做是分类算法。通常作为分类算法,一般用于解决二分类问题。 线性回归 ...
分类:
其他好文 时间:
2018-07-19 13:38:19
阅读次数:
232
?1.SVM 的基本思想: ?SVM把分类问题转换成寻求分类平面的问题,并通过最大化分类边界点到分类平面的距离来实现分类。通俗的讲支持向量机的解决的问题是找到最好的分类超平面。支持向量机(Support vector machine)通常用来解决二分类问题 ? 2.构造目标函数 类似于点到直线的距离 ...
分类:
其他好文 时间:
2018-07-19 13:29:58
阅读次数:
210
# # 由于逻辑回归解决的是分类问题,而且是二分类,因此定义损失函数时也要有两类 # 1)如果 y = 1(p ≥ 0.5),p 越小,损失函数越大; # 2)如果 y = 0(p ≤ 0.5),p 越大,损失函数越大; # 模型变形: # 最终的损失函数模型: # 该模型不能优化成简单的数学表达式 ...
分类:
其他好文 时间:
2018-07-15 21:28:39
阅读次数:
197
性能度量是衡量模型泛化能力的评判标准,性能度量反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果,因此什么样的模型是好的,不仅取决于算法和数据,还取决于任务需求。 1、错误率和精度 其实说白了就是我们的损失函数所体现的指标,比如常见的在分类问题中分类错误类别所占的比例 ...
分类:
其他好文 时间:
2018-07-15 21:24:50
阅读次数:
318
不均衡学习的抽样方法 通常情况下,在不均衡学习应用中使用抽样方法的目的就是为了通过一些机制改善不均衡数据集,以期获得一个均衡的数据分布。 研究表明,对于一些基分类器来说,与不均衡的数据集相比一个均衡的数据集可以提高全局的分类性能。数据层面的处理方法是处理不均衡数据分类问题的重要途径之一,它的实现方法 ...
分类:
其他好文 时间:
2018-07-12 10:34:19
阅读次数:
620
Logistic回归算法调试 一、算法原理 Logistic回归算法是一种优化算法,主要用用于只有两种标签的分类问题。其原理为对一些数据点用一条直线去拟合,对数据集进行划分。从广义上来讲这也是一种多元线性回归方法,所不同的是这种算法需要找出的是能够最大可能地将两个类别划分开来而不是根据直线关系预测因 ...
分类:
编程语言 时间:
2018-07-11 00:57:31
阅读次数:
164
https://www.kaggle.com/c/whale-categorization-playground 希望后面能看到好的处理方法 https://www.kaggle.com/c/whale-categorization-playground 不平衡类的问题是什么? 在一个分类问题中,当 ...
分类:
其他好文 时间:
2018-07-07 20:35:54
阅读次数:
172