转自: https://blog.csdn.net/ch1209498273/article/details/78266558 在有监督的机器学习中,经常会说到训练集(train)、验证集(validation)和测试集(test),这三个集合的区分可能会让人糊涂,特别是,有些读者搞不清楚验证集和测 ...
分类:
其他好文 时间:
2018-05-22 20:43:40
阅读次数:
470
机器学习的任务是从属性X预测标记Y,即求概率P(Y|X); 有监督学习 training data给了正确的答案即label,任务就是建立相应的模型,训练样本集外的数据进行分类预测。 生成式模型 生成模型学习一个联合概率分布P(x,y) 常见的判别方法有 k近邻法、感知机、决策树、逻辑回归、线性回归 ...
分类:
其他好文 时间:
2018-04-22 12:55:52
阅读次数:
188
1.不同输出空间上的学习 二分类问题 多分类问题 回归问题 结构化的问题(有趣且复杂,可从多分类的问题衍生而来) ... 2.不同数据标签上的学习 有监督的学习 无监督的学习 无监督的多分类 聚类 (比监督式的困难,但是更实用) 无监督的应用: 聚类 文章 = 主题 用户画像 = 用户群 密度分析 ...
分类:
其他好文 时间:
2018-04-21 19:41:03
阅读次数:
145
转载自:https://www.leiphone.com/news/201706/dTRE5ow9qBVLkZSY.html 数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样本的分类性能下降。绝大多数常见的 ...
分类:
其他好文 时间:
2018-04-12 19:52:49
阅读次数:
1144
目录: 机器学习基础: 机器学习的分类与一般思路 微积分基础: 泰勒公式,导数与梯度 概率与统计基础: 概率公式、常见分布、常见统计量 线性代数基础: 矩阵乘法的几何意义 这是一张非常著名的图,请仔细挖掘其信息量。以期它在整体上指引我们的学习。 1 机器学习基础 1.1 机器学习分类 有监督学习、无 ...
分类:
其他好文 时间:
2018-04-09 11:08:29
阅读次数:
302
内容:线性回归;逻辑回归,应用场景。 一、线性回归 有监督学习,根据学习样本{x->y},学习一个映射f:X->Y(线性相关),输出预测结果y_i。最简单的例子:y=ax+b 重要组成:训练数据集 training set, 学习算法 learning algorithm, 损失函数 loss fu ...
分类:
其他好文 时间:
2018-03-25 14:27:24
阅读次数:
235
对于机器学习的实际运用。光停留在知道了解的层面还不够,我们须要对实际中easy遇到的一些问题进行深入的挖掘理解。我打算将一些琐碎的知识点做一个整理。 1 数据不平衡问题 这个问题是经常遇到的。就拿有监督的学习的二分类问题来说吧。我们须要正例和负例样本的标注。假设我们拿到的训练数据正例非常少负例非常多 ...
分类:
编程语言 时间:
2018-03-23 19:23:56
阅读次数:
283
数据分析和判别的过程中,存在数值化特征和非数值化特征。 对非数值化特征,使用人工神经网络或支持向量机则需要对数据进行编码后进行分类,但是分明显编码之后大幅度增加了数据的维度。因此引入决策树的方法。 决策树是一种利用一定的训练样本从数据中学习规则的模型,很明显他是一种有监督学习(supervised ...
分类:
其他好文 时间:
2018-03-22 17:22:04
阅读次数:
163
论文地址:《Rich feature hierarchies for accurate object detection and semantic segmentation》 论文包含两个关键:(1)使用CNN处理候选框,以便定位个分割目标。(2)当训练集较小时,有监督的预训练和特点区域的微调。 介 ...
分类:
其他好文 时间:
2018-03-16 20:22:13
阅读次数:
198
按照我们对于变量的分类:分为数值变量和分类变量,数值变量可以分为连续型和离散型,分类变量又有有序的和无序的。下面我将介绍一些对于这些变量进行离散化处理。 无序分类变量的离散化方法: 比如在泰坦尼克号当中,有一个变量叫做乘客登陆的港口,取值为(C, Q, S)代表三个地方。这是一个典型的无序分类变量, ...
分类:
其他好文 时间:
2018-03-15 22:14:14
阅读次数:
292