一.混淆矩阵 (一).简介 在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。在图像精度评价中,主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个实测像元的位置和分类与分类图像中的相 ...
分类:
其他好文 时间:
2018-04-07 17:42:07
阅读次数:
862
机器学习的定义 计算机程序从经验E中学习,解决某一任务T、进行某一性能度量P,通过P测定在T上的表现因E而提高。 简而言之:程序通过多次执行之后获得学习经验,利用这些经验可以使得程序的输出结果更为理想,就是机器学习。 主要的两类机器学习算法 监督学习和无监督学习 监督学习 定义:对于数据集中的每个样 ...
分类:
其他好文 时间:
2018-04-07 15:02:06
阅读次数:
127
1.要求 本次项目提供一系列的英文句子对,每个句子对的两个句子,在语义上具有一定的相似性;每个句子对,获得一个在0-5之间的分值来衡量两个句子的语义相似性,打分越高说明两者的语义越相近。 如: 2.基本实现过程 2.1 数据处理: (1) 分词: (2)去停用词:停用词是一些完全没有用或者没有意义的 ...
分类:
其他好文 时间:
2018-03-28 21:59:21
阅读次数:
249
10:28 1. 引言(Introduction) 1.1 Welcome 1.2 什么是机器学习(What is Machine Learning) 1.3 监督学习(Supervised Learning) 1.4 无监督学习(Unsupervised Learning) 2 单变量线性回归(Linear Regression with One Variable) 2.1 模型表示(Model
分类:
其他好文 时间:
2018-03-22 11:27:52
阅读次数:
265
一、无监督学习 1、聚类:是一个将数据集中在某些方面相似的数据成员进行分类组织的过程。因此,一个聚类就是一些数据实例的集合。聚类技术经常被称为无监督学习。 二、K-均值聚类 1、k—均值算算法:是发现给定数据集k个簇的算法 2、步骤: 1)、随机选取k个数据点作为初始的聚类中心(要求发现k个簇)。 ...
分类:
编程语言 时间:
2018-03-21 21:07:42
阅读次数:
252
机器学习算法简单入门。 由于团队(大数据团队)技术发展需要,借对交通业务数据进行需求拓展,实现数据挖掘和数据分析技术的掌握,绕不开机器学习算法,可以说,大数据的核心价值在于算法。 如下图,当前机器学习按照任务类型可以分为有监督学习和无监督学习,这两者的区别在于你是否告诉程序一个标签,或者叫答案,一个 ...
分类:
编程语言 时间:
2018-03-07 23:59:41
阅读次数:
306
无监督学习中,我们已知的数据。看上去有点不一样,不同于监督学习的数据的样子,即无监督学习中没有任何的标签或者是有相同的标签或者就是没标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,就是一个数据集。你能从数据中找到某种结构吗?针对数据集,无监督学习就能判断出数据有两个 ...
分类:
其他好文 时间:
2018-02-27 10:55:41
阅读次数:
140
有监督学习类似于学习数学,先做题 对答案,然后老师出卷子进行月考 无监督学习 挖掘数据 需要与环境交互 回归问题数学用语比较多,但是对大学高数部分熟悉的话,应该不是问题。 线性回归 损失函数(loss function,优化方向,评估方式)/代价函数/目标函数 找到最好的权重/参数 如何衡量最好? ...
分类:
其他好文 时间:
2018-02-19 11:34:36
阅读次数:
141
无监督学习 1、简介 无监督学习 是一种对不含标记的数据建立模型的机器学习范式。最常见的无监督学习方法是 聚类 ,就是讲无标记的数据分成几种集群,这些集群通常是根据某种相似度指标进行的,如欧氏距离(Euclidean distance),常用领域有:数据挖掘、医学影像、股票市场分析、计算机视觉、市场 ...
分类:
其他好文 时间:
2018-02-14 10:35:37
阅读次数:
388
1 无监督学习:在不知道数据点的含义的情况下,从一个数据集中找出数据点的结构关系。 2 聚类算法:相同属性的数据点会集中分布,聚集在一起,聚类算法将数据集分成不同的聚类。也就是说,机器不知道这些数据点具体是什么属性,到底是干什么的,但是可以将具有相同属性的数据点归为一类。 3 无监督学习的应用: 大 ...
分类:
其他好文 时间:
2018-02-13 17:57:47
阅读次数:
154