在机器学习中,我们通过一些已标记的数据(已知的数据,带有标签,确定了其种类和一些属性数值的数据记录)记录成图表等,比如在进行分类问题的训练过程中, 如果特性只有两个,那么可以列平面图表来表示对应的labeled data, 即类似 的图像(来自百度图片), 其中的曲线既是决策边界,如果我们用一个表格 ...
分类:
其他好文 时间:
2020-06-24 23:46:24
阅读次数:
63
(1)说明:当y为一系列离散值时,问题转为分类问题。比如我们要根据一个肿瘤的大小判断肿瘤是为良性还是为恶性。 (2)假设函数:如下图,如果使用线性的方程作为假设函数,肿瘤大小作为横坐标,是否为恶性作为纵坐标。当y值小于0.5时判定为良性,大于0.5时判定为恶性。但有两个缺点:①经过计算会出现y值远大 ...
分类:
其他好文 时间:
2020-06-24 20:05:02
阅读次数:
56
Factorization Machines (FM) 首先这种算法是一种有监督的机器学习模型,既可以用在分类问题也可以用在回归问题当中,它是一种非线性的模型,相比逻辑回归具备了二阶交叉特征表达能力(不易拓展到三阶以上)。可以通过stochastic(随机) gradient descent (SG ...
分类:
系统相关 时间:
2020-06-22 22:48:15
阅读次数:
86
算法原理 朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。 该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。 但由于该算法以自变量之间的独立(条件特征独立)性和连续变 ...
分类:
编程语言 时间:
2020-06-17 20:14:27
阅读次数:
73
目录 textRNN简介 textRNN网络结构 总结 一句话简介:textRNN指的是利用RNN循环神经网络解决文本分类问题,通常使用LSTM和GRU这种变形的RNN,而且使用双向,两层架构居多。 一、textRNN简介 这里的文本可以一个句子,文档(短文本,若干句子)或篇章(长文本),因此每段文... ...
分类:
其他好文 时间:
2020-06-17 01:58:03
阅读次数:
72
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 什么是:逻辑回归本质上是一个线性回归模型,是一种用来解决二分类问题的机器学习方法,用于估计某种事物的可能性。 逻辑回归公式: 和线性回归的不同(直接上的不同):逻辑回归中因变量都是分类型变量,而线性回归的是连续性数值变量,并且逻辑 ...
分类:
其他好文 时间:
2020-06-16 13:01:30
阅读次数:
49
作者|Anuj Shrivastav 编译|VK 来源|Medium 介绍 监督学习描述了一类问题,涉及使用模型来学习输入示例和目标变量之间的映射。如果存在分类问题,则目标变量可以是类标签,如果存在回归问题,则目标变量是连续值。一些模型可用于回归和分类。我们将在此博客中讨论的一种这样的模型是支持向量 ...
分类:
其他好文 时间:
2020-06-15 14:18:38
阅读次数:
76
一、定义问题,收集数据集 首先要清楚面对问题的输入数据是什么?要预测什么? 收集这些数据,有需要的话用标签来标注数据。 其次要清楚面对的是什么类型的问题?是二分类问题、多分类问题、标量回归问题、向量回归问题,还是多分类、多标签问题?或者是其他问题,比如聚类、生成或强化学习?确定问题类型有助于你选择模 ...
分类:
其他好文 时间:
2020-06-15 12:16:26
阅读次数:
47
背景解决的二分类问题,如手写识别0-9目标:逻辑回归返回一个概率值[0-1]逻辑回归的特点:快、效果好、容易实时在线预测、利于分析方法:定义一个条件概率,如p(Y|X)相当于用模型来捕获输入X和输出Y之间的关系,如推导对于二分类问题,由于p(Y|X)的值域在[-∞,+∞],为了令其至于范围压缩到[-1,1]之间,故推荐使用sigmoid函数,故得两式子合并,可得关于使用sigmoid前面说道使用该
分类:
其他好文 时间:
2020-06-15 10:05:46
阅读次数:
55
1)数据或训练过程变化; 2)分类问题,降维可视化后锚定分类中心不发生波动 (category center constrained dimension reduction) ...
分类:
其他好文 时间:
2020-06-11 20:10:23
阅读次数:
52