库的基本功能 sklearn库共分为6大部分,分别用于完成分类任务、回归任务、聚类任务、降维任务、模型选择以及数据的预处理。 前4类功能: 1.分类任务;对于支持向量机这个分类算法而言,需要调用svm.SVC这个模块 2.回归任务 3.聚类任务 4.降维任务 内置数据 ...
分类:
其他好文 时间:
2019-01-09 13:30:01
阅读次数:
219
最近我在想,有没有可能检测出一幅图像的主色。最后我使用k-means聚类算法取得了很好的效果。我使用python OpenCV和scikit-learn实现了它。 怎么运作的? k-means是机器学习中使用的聚类算法,其中一组数据点将被分类为“k”组。它适用于简单的距离计算。 图像分割 分割将图像 ...
分类:
其他好文 时间:
2019-01-05 20:37:04
阅读次数:
238
数据库 IO类 统计类 描述性统计 回归(包括统计和机器学习) 假设检验 时间序列 生存分析 机器学习类 分类器 LDA、QDA SVM(支持向量机) 基于临近 贝叶斯 决策树 Assemble方法 聚类 关联规则 神经网络 概率图模型 文本、NLP 基本操作 主题模型 与其他分析/可视化/挖掘/报 ...
分类:
编程语言 时间:
2019-01-03 22:37:25
阅读次数:
522
常用的数据变换方法 均值: 标准差: 中心化变换: 标准化变换: 极化正规化变换(规格化变换): 对数变换: 距离和相似系数 距离: 明氏距离: 当q=1时,为绝对距离 当q=2时,为欧式距离 当q=∞时,为切比雪夫距离 兰氏距离: 斜交空间距离: 马氏距离: 两样品间: 样品到总体: 相似系数: ...
分类:
其他好文 时间:
2019-01-01 17:54:48
阅读次数:
194
理解问题 客户细分需要解决的问题是按照客户之间的相似特征区分不同客户群体。这个问题的先决条件中没有可供使用的客户分类列表,只有客户的人物画像。 数据集 已有的数据是公司的历史商业活动记录以及客户的购买记录。 offer.csv: transaction.csv: 预处理 需要对两个数据集做关联处理, ...
分类:
Web程序 时间:
2018-12-31 21:15:56
阅读次数:
205
聚类算法总结 原文:http://blog.chinaunix.net/uid-10289334-id-3758310.html 聚类算法的种类:基于划分聚类算法(partition clustering) k-means: 是一种典型的划分聚类算法,它用一个聚类的中心来代表一个簇,即在迭代过程中选 ...
分类:
编程语言 时间:
2018-12-30 12:52:57
阅读次数:
237
实例要求:以sklearn库自带的iris数据集为例,使用sklearn估计器构建K-Means聚类模型,并且完成预测类别功能以及聚类结果可视化。 实例代码: 实例结果: 构建的K-Means模型为: 花瓣预测结果: 聚类结果可视化: ...
分类:
其他好文 时间:
2018-12-27 22:52:10
阅读次数:
294
Spark2.x机器学习视频教程讲师:轩宇老师链接:https://pan.baidu.com/s/1TcFl6KDjxJS597TxYFSCOA密码:3t2z本课程讲解Spark在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、分类等经典机器学习算法及其实际应用,涵盖使用SparkMLPipelineAPI创建和调试机器学习流程,内容更加系统、
分类:
其他好文 时间:
2018-12-25 13:57:46
阅读次数:
150
sklearn是python的重要机器学习库,其中封装了大量的机器学习算法,如:分类、回归、降维以及聚类;还包含了监督学习、非监督学习、数据变换三大模块。sklearn拥有完善的文档,使得它具有了上手容易的优势;它内置了大量的数据集,节省了获取和整理数据集的时间。因而,使其成为了广泛应用的重要的机器 ...
分类:
编程语言 时间:
2018-12-25 13:15:04
阅读次数:
203
国内博客,上介绍实现的K-medodis方法为: 与K-means算法类似。只是距离选择与聚类中心选择不同。 距离为曼哈顿距离 聚类中心选择为:依次把一个聚类中的每一个点当作当前类的聚类中心,求出代价值最小的点当作当前聚类中心。 维基百科上,实现的方法为PAM算法。 分成K类,把每个点都尝试当作聚类 ...
分类:
编程语言 时间:
2018-12-23 20:43:51
阅读次数:
271