import numpy as np import matplotlib.pyplot as plt from sklearn import cluster from sklearn.metrics import adjusted_rand_score from sklearn.datasets.s... ...
分类:
编程语言 时间:
2019-04-30 23:22:54
阅读次数:
169
对于原始数据分布倾斜 利用统计或数学变换来减轻数据分布倾斜的影响。使原本密集的区间的值尽可能的分散, 原本分散的区间的值尽量的聚合。 Log变换通常用来创建单调的数据变换。它的主要作用在于帮助稳定方差,始终保持分布 接近于正态分布并使得数据与分布的平均值无关。 y=logc(1+λx) λ通常设置为 ...
分类:
其他好文 时间:
2019-04-29 12:58:32
阅读次数:
164
类似Uber,需要处理处不同时间段的不同地区的订单热点区域,帮助进行网约车的及时调度处理 每个成交单Order中,都会有订单上车位置的起始经纬度:open_lat , open_lng 那么在这个时间段内,哪些地区是高密集订单区域,好进行及时的调度,所以需要得到不同地区的热力图 初期想法是基于经纬度 ...
分类:
其他好文 时间:
2019-04-27 21:18:58
阅读次数:
226
这次,我们将使用k-Shape时间序列聚类方法检查与我们有业务关系的公司的股票收益率的时间序列。 执行环境如下。 R:3.5.1 企业对企业交易和股票价格 在本研究中,我们将研究具有交易关系的公司的价格变化率的时间序列的相似性,而不是网络结构的分析。由于特定客户的销售额与供应商公司的销售额之比较大, ...
分类:
编程语言 时间:
2019-04-23 17:39:38
阅读次数:
649
MATLAB程序:用FCM分割脑图像 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 脑图像基础知识请看:脑图像;FCM算法介绍请看:聚类——FCM;数据来源:BrainWeb: Simulated Brain Database,只选取脑图像中的0、1 ...
分类:
其他好文 时间:
2019-04-23 15:48:43
阅读次数:
321
一.学习的类型 1.根据输出空间:分类(二分类,多类别分类),回归,结构化 二分类:解决是非问题 多类别分类:邮递区号的辨识,邮件分类,图像辨识 回归:预测股票走势,预测天气 结构化:自然语言辨识 2.根据标签:监督学习,非监督学习,半监督学习,强化学习 非监督学习:聚类、密度分析、离群点检测(目标 ...
分类:
其他好文 时间:
2019-04-19 17:44:51
阅读次数:
189
hadoop的基本概念伪分布式hadoop集群安装hdfs、MapReduce演示互联网正在从IT走向DT时代。大数据应用分析1、统计类的分析2、推荐类的分析3、机器学习(分类,聚类)4、人工智能、预测(算法)一、什么是hadoop官网:http://hadoop.apache.orghadoop是apache旗下的一套开源软件平台。是一个可靠的、可扩展的、可分布式计算的开源软件。apacheha
分类:
其他好文 时间:
2019-04-19 12:11:49
阅读次数:
176
一、 概述:(用精炼的语言描述文章的整体思路及结果) 本文选择四个不同的数据集,分为基于谱图数计数和基于峰值强度计数的无标记定量两种情况,对谱图进行聚类算法分析,提高了低丰度蛋白的可检测性,并开发了可直接使用的聚类方法的PD节点。 二、 研究背景: 无标记量化已成为许多基于质谱的蛋白质组学实验中的常 ...
分类:
其他好文 时间:
2019-04-15 10:32:52
阅读次数:
182
1 什么是聚类算法? 聚类算法就是根据特定的规则,将数据进行分类。分类的输入项是数据的特征,输出项是分类标签,它是无监督的。 常见的聚类规则包括:1)基于原型的,例如有通过质心或中心点聚类,常见的算法KMeans;2)基于图的,也就是通过节点和边的概念,形成连通分支的分类,常见的算法是凝聚层次聚类, ...
分类:
编程语言 时间:
2019-04-15 01:04:47
阅读次数:
153
三维配准中经常被提及的配准算法是ICP迭代的方法,这种方法一般般需要提供一个较好的初值,也就是需要粗配准,同时由于算法本身缺陷,最终迭代结果可能会陷入局部最优,导致配准失败,往往达不到我们想要的效果。本文介绍的是另一种比较好的配准算法,NDT配准。所谓NDT就是正态分布变换,作用与ICP一样用来估计 ...
分类:
其他好文 时间:
2019-04-14 16:15:23
阅读次数:
710