判别分析包括可用于分类和降维的方法。线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术。二次判别分析(QDA)是LDA的变体,允许数据的非线性分离。最后,正则化判别分析(RDA)是LDA和QDA之间的折衷。 本文主要关注LDA,并探讨其在理论和实践中作为分类和可视化技术的用途。由于QDA ...
分类:
编程语言 时间:
2019-05-06 19:33:01
阅读次数:
312
1、朴素贝叶斯 朴素贝叶斯是使用概率论来分类的算法。其中朴素:各特征条件独立;贝叶斯:根据贝叶斯定理。 根据贝叶斯定理,对一个分类问题,给定样本特征B,样本属于类别A的概率是: 2、算法特点 优点: 在数据较少的情况下仍然有效,可以处理多类别问题。 缺点: 对于输入数据的准备方式较为敏感。 适用数据 ...
分类:
编程语言 时间:
2019-05-05 12:02:31
阅读次数:
186
import numpy as np import matplotlib.pyplot as plt from sklearn.svm import SVC from sklearn.datasets import load_iris from sklearn.preprocessing impor... ...
分类:
编程语言 时间:
2019-05-02 15:56:29
阅读次数:
203
大白话5分钟带你走进人工智能-第二十节逻辑回归和Softmax多分类问题(5) 上一节中,我们讲解了逻辑回归的优化,本节的话我们讲解逻辑回归做多分类问题以及传统的多分类问题,我们用什么手段解决。 先看一个场景,假如我们现在的数据集有3个类别,我们想通过逻辑回归建模给它区分出来。但我们知道逻辑回归本质 ...
分类:
其他好文 时间:
2019-05-02 00:20:02
阅读次数:
174
提供好的特征是机器学习任务中最重要的工作,那么何为优秀的机器学习特征?以及如何高效地组合这些特征? 以二分类问题为例,好的特征具有很好的区分性。例如学习任务是区分两种不同类型的狗:灰猎犬(Greyhound)和拉布拉多犬(Labrador)。假设有身高和眼睛的颜色两种特征。一般而言,灰猎犬的平均身高 ...
分类:
其他好文 时间:
2019-04-30 14:16:04
阅读次数:
113
k-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高。 适用范围:数值型、标称型。 工作原理:存在一个样本数据集合(训练样本集),并且样本集中每个数据都存在标签。输入没有标签的新数据后,将数据的每个特征与样本集中数据 ...
分类:
编程语言 时间:
2019-04-29 20:58:38
阅读次数:
175
转自:https://blog.csdn.net/tsyccnh/article/details/79163834 关于交叉熵在loss函数中使用的理解交叉熵(cross entropy)是深度学习中常用的一个概念,一般用来求目标与预测值之间的差距。以前做一些分类问题的时候,没有过多的注意,直接调用 ...
分类:
其他好文 时间:
2019-04-18 00:45:09
阅读次数:
983
一、【概述】 1、含义: 支持向量机(support vector machine,SVM)是一种二类分类器,它的基本模型是定义在特征空间上的间隔最大化的线性分类器,通过引入核函数,也可以作为非线性分类器来解决非线性数据集的分类问题。 2、求解: 支持向量机的学习策略是间隔最大化,可转化为一个求解凸 ...
分类:
其他好文 时间:
2019-03-30 17:20:50
阅读次数:
192
要根据不同的目标选取合适的评估指标。 进行二分类问题的时候,数据集之间的不平衡,会导致评价指标accuracy很高,但是却不能反应模型的好坏。 sklearn.metrics.confusion_matrix 如果标记数字的话,则按标签从小到大排序,如果为字符型的化,自己设计labels参数来表示其 ...
分类:
其他好文 时间:
2019-03-30 10:42:44
阅读次数:
145
图像分割 图像分割是什么?如果下学术定义,就是把图像分割成想要的语义上相同的若干子区域,看上面的自动驾驶的分割任务,路是路,车是车,树是树。这些子区域,组成图像的完备子集,相互之间不重叠。图像分割可以被看作是一个逐像素的图像分类问题。 ...
分类:
其他好文 时间:
2019-03-23 10:30:43
阅读次数:
202