码迷,mamicode.com
首页 >  
搜索关键字:聚类 k-meas k均值    ( 1791个结果
机器学习与数据挖掘150道题
单选题 1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 2. 以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 ( ...
分类:其他好文   时间:2019-07-09 13:36:22    阅读次数:106
k-means
聚类算法中最简单高效的。 利用邻近的信息来标注样本的类别。 重点:初始k个质心,重复迭代直到收敛。 欧式空间的样本,使用平方误差和作为目标函数。 1、优点 快,简单,效果还可以,适合高维 2、缺点 受初始质心的影响,k的选取也很关键 3、距离度量 曼哈顿,欧氏距离 4、k的选取 手肘:k越来越接近真 ...
分类:其他好文   时间:2019-07-07 12:45:04    阅读次数:64
机器学习1
机器学习主要由监督学习、无监督学习。 监督学习主要用于解决分类和回归问题。 无监督学习主要用于解决聚类问题。 在机器学习过程中主要有以下几个步骤: 数据预处理 特征工程 数据建模 结果评估 首先介绍数据预处理,主要包括数据清洗、数据采样以及数据集的拆分三个部分。 在数据清洗过程中主要对各种脏数据进行 ...
分类:其他好文   时间:2019-07-05 00:38:17    阅读次数:170
python sklearn库实现逻辑回归的实例代码
Sklearn简介 Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。当我们面临机 ...
分类:编程语言   时间:2019-07-01 13:51:44    阅读次数:140
机器学习与数据挖掘期末考试复习重点整理
分类: – 有类别标记信息, 因此是一种监督学习 – 根据训练样本获得分类器,然后把每个数据归结到某个已知的类,进而也可以预测未来数据的归类。 聚类: – 无类别标记, 因此是一种无监督学习 – 无类别标记样本,根据信息相似度原则进行聚类,通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布 ...
分类:其他好文   时间:2019-06-30 09:28:26    阅读次数:90
阅读之推荐系统
推荐是当代各个系统的重要流量入口。近年来推荐发展逐渐的多样化,场景上逐渐覆盖到各流量入口,推荐的实体也扩展到活动、类目、运营位等。 在网站里进行推荐,可以提高整个网站的有效转化率,提高用户使用系统的舒适度。通过用户已经浏览的记录,更精准的理解用户需求,对用户进行聚类、打标签,推荐给用户感兴趣的,帮助 ...
分类:其他好文   时间:2019-06-26 13:34:41    阅读次数:124
《数据挖掘导论》实验课——实验七、数据挖掘之K-means聚类算法
实验七、数据挖掘之K-means聚类算法 一、实验目的 1. 理解K-means聚类算法的基本原理 2. 学会用python实现K-means算法 二、实验工具 1. Anaconda 2. sklearn 3. matplotlib 三、实验简介 1 K-means算法简介 k-means算法是一 ...
分类:编程语言   时间:2019-06-24 21:03:25    阅读次数:267
0A04 无监督学习:聚类(1) k-means
这是一个非常简单的聚类算法,算法的目的就是找到这些中心点的合适坐标,使得所有样本到其分组中心点距离的平方和最小. K-means 的中心点向量不一定是训练样本中某成员的位置 import numpy as npfrom sklearn.cluster import KMeans # 引入K-mean ...
分类:其他好文   时间:2019-06-21 22:37:46    阅读次数:170
0A04 无监督学习:聚类(2) 近邻算法(Affinity Propagation)
AP算法,具有结果稳定可重现 训练前不用制定K-means中K值,但是算法的时间复杂度比K-means高 import numpy as npfrom sklearn.cluster import AffinityPropagation # 引入AP算法聚类 X = np.array([[1,2], ...
分类:编程语言   时间:2019-06-21 22:28:52    阅读次数:141
机器学习K-Means
1.K-Means聚类算法属于无监督学习算法。 2.原理:先随机选择K个质心,根据样本到质心的距离将样本分配到最近的簇中,然后根据簇中的样本更新质心,再次计算距离重新分配簇,直到质心不再发生变化,迭代结束。 3.簇内平方和Inertia:采用欧几里得距离,则一个簇中所有样本点到质心的距离的平方和。追 ...
分类:其他好文   时间:2019-06-21 21:07:03    阅读次数:239
1791条   上一页 1 ... 34 35 36 37 38 ... 180 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!