码迷,mamicode.com
首页 > 编程语言 > 详细

k均值算法

时间:2020-04-16 22:23:33      阅读:70      评论:0      收藏:0      [点我收藏+]

标签:nbsp   手动   大数据时代   png   通过   learn   大数据   过程   扑克牌   

1). 扑克牌手动演练k均值聚类过程:>30张牌,3类

实验总牌数为30,分三类进行三轮迭代。

第一轮:抽取聚类中心为:3、4、7.

技术图片

 

 聚类结果为:

技术图片

 

 第二轮:经过求平均后,重新确定聚类中心为:2、4、10

技术图片

 

 第三轮:对上类再进行求平均,选定聚类中心为2、5、10

技术图片

 

 

最终聚类中心稳定在2、5、10,以此为小中大划分。

 

 

2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)

 

3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.

代码:

技术图片

 

散点图显示为:

 技术图片

 

 

4). 鸢尾花完整数据做聚类并用散点图显示.

代码:(经上代码修改来的,稍有瑕疵)

技术图片

 

 散点图:

技术图片

 

 

 

5).想想k均值算法中可以用来做什么?

  最主要的就是进行机器学习啊,再加上如今是大数据时代,数据足够训练模型简直如虎添翼,

应用到生活中的比如,手机上会自动帮你标记哪些是骚扰电话,就是通过许多用户的数据进行机器学习得到的,比如说童话时常,对用户接起来一秒挂断的电话进行记录,被很多用户一秒挂断,就标记是骚扰电话

k均值算法

标签:nbsp   手动   大数据时代   png   通过   learn   大数据   过程   扑克牌   

原文地址:https://www.cnblogs.com/crjia/p/12716068.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!