1). 扑克牌手动演练k均值聚类过程: 30张牌,3类 第一轮:2 7 11 第二轮:3 7 11 第三轮与第二轮一致,所有排序结束。 2). 自主编写K means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度 ...
分类:
编程语言 时间:
2020-04-14 00:39:47
阅读次数:
67
数据集网站收集(持续更新) 1.Kaggle: "https://www.kaggle.com/" 可以按关键字搜索数据集 自带讨论区 有热心群众分享自己的Kernel,可供参考(热心群众们自己对数据的分析代码) 2.天池: "https://tianchi.aliyun.com/competiti ...
分类:
Web程序 时间:
2020-04-14 00:31:38
阅读次数:
89
Integrating Weakly Supervised Word Sense Disambiguation into Neural Machine Translation 一篇关于机器翻译的论文,目的是是将词义信息加到机器翻译模型中,以此缓解机器翻译模型对于多义词翻译不准确的问题。 引入的方法很 ...
分类:
其他好文 时间:
2020-04-11 20:30:33
阅读次数:
91
1.前言 算法是完成分析任务所采纳或者遵循的一整套步骤和规则,它是计算机科学中一个基本概念,可视作计算机科学的基石。设计优雅高效的代码、准备和处理数据以至软件工程开发均以算法为基础。 排序、查找、基于图的计算等问题都是算法能够解决的。然而,对于同一个问题,基于效率和计算时间的考虑,可以选出某个相对最 ...
分类:
编程语言 时间:
2020-04-10 00:05:01
阅读次数:
94
聚类K-means算法 问题:给你一张这样的图,也没给其他信息,让你去给他们分类?怎么分类 那么,我们可能会以帽子或头发等为特征对他们进行分类,物以类聚,人以群分 聚类的原理: 1. 随机在数据当中抽取三个样本,当做三个类别的中心点(k1,k2,k3). ##图一,颜色实心标记## 2. 计算其余的 ...
分类:
编程语言 时间:
2020-04-06 09:18:16
阅读次数:
73
按照任务类型可分为: 回归模型 :例如预测明天的股价。 分类模型 :将样本分为两类或者多类。 结构化学习模型 :输出的不是向量而是其他 结构。 按照学习理论可分为: 监督学习 :学习的样本 全部 具有标签,训练网络得到一个最优模型。 无监督学习 :训练的样本 全部 无标签,例如 聚类样本。 半监督学 ...
分类:
其他好文 时间:
2020-04-04 16:17:11
阅读次数:
122
机器学习分为四大块,分别是classification (分类),regression (回归), clustering (聚类), dimensionality reduction (降维)。 聚类(clustering) 无监督学习的结果。聚类的结果将产生一组集合,集合中的对象与同集合中的对象彼 ...
分类:
其他好文 时间:
2020-03-28 16:14:52
阅读次数:
398
sklearn PAI:from sklearn.cluster import KMeans 聚类的原理 评价指标:轮廓系数,一般[-1,1]之间,一般超过0-0.1聚类效果已经十分不错 from sklearn.cluster import KMeans # K-means PAI import ...
分类:
其他好文 时间:
2020-03-27 12:47:49
阅读次数:
64
""" 机器学习算法分类: 监督学习(有目标值) 分类(目标值是离散型数据):K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络 回归(目标值是连续型数据):线性回归、岭回归 无监督学习(无目标值):聚类 K-means 机器学习一般会把数据集划分为训练集(3/4)和测试集(1/4),可 ...
分类:
编程语言 时间:
2020-03-26 01:37:29
阅读次数:
103
1.聚类代码: 1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 # @File : 聚类2.py 4 # @Author: 赵路仓 5 # @Date : 2020/3/19 6 # @Desc : 7 # @Contact : 3983334 ...
分类:
编程语言 时间:
2020-03-22 22:26:38
阅读次数:
88