最近在研究sample之间的similarity,以便更好地进行clustering,一下是相关资料 TF-IDF与余弦相似性的应用(一):自动提取关键词 TF-IDF与余弦相似性的应用(二):找出相似文章 相似度(距离计算)汇总 常用的相似度计算方法原理及实现 机器学习中的相似性度量 大量短文本聚 ...
分类:
其他好文 时间:
2019-06-11 11:19:49
阅读次数:
125
机器学习是时下流行AI技术中一个很重要的方向,无论是有监督学习还是无监督学习都使用各种“度量”来得到不同样本数据的差异度或者不同样本数据的相似度。良好的“度量”可以显著提高算法的分类或预测的准确率,本文中将介绍机器学习中各种“度 ...
分类:
其他好文 时间:
2019-06-09 00:52:20
阅读次数:
143
对AUC的一些理解1.AUC(Area Under ROC Curve)是对机器学习模型的一种性能度量,其直观的意义是ROC(Receiver Operating Characteristic)围成的面积,然而很多文章对AUC的计算公式与其直观意义“面积”的对应描述不甚明了,于是我花了一些时间研究了 ...
分类:
其他好文 时间:
2019-06-06 14:16:53
阅读次数:
160
简述: 在k8s早期版本中,对资源的监控使用的是heapster的资源监控工具。 但是从 Kubernetes 1.8 开始,Kubernetes 通过 Metrics API 获取资源使用指标,例如容器 CPU 和内存使用情况。 这些度量指标可以由用户直接访问,例如通过使用kubectl top ...
分类:
其他好文 时间:
2019-06-06 00:29:44
阅读次数:
1060
获得任意N个区分度最高的RGB颜色值是一个经典的问题,之前在做一些可视化的东西时需要解决这个问题。首先去网上找了一些方法,未果,于是想自己来搞,心里的想法是,先给出一个距离函数用来度量两个RGB颜色值的区分度,然后再通过随机和贪心的方式依次获得N个颜色值。如果要这样搞的话,距离函数的定义就非常关键了 ...
分类:
编程语言 时间:
2019-06-05 10:07:05
阅读次数:
276
交叉熵公式 参考回答: 交叉熵:设p(x)、q(x)是X中取值的两个概率分布,则p对q的相对熵是: 在一定程度上,相对熵可以度量两个随机变量的“距离”,且有D(p||q) ≠D(q||p)。另外,值得一提的是,D(p||q)是必然大于等于0的。 互信息:两个随机变量X,Y的互信息定义为X,Y的联合分 ...
分类:
编程语言 时间:
2019-06-03 21:41:01
阅读次数:
422
目录: 一:概述 二:无失真图像压缩编码 三:有限失真图像压缩编码 四:图像编码新技术 一:概述: 由于图像信息的编码必须在保持信息源内容不变,或者损失不大的前提下才有意义,这就必然涉及到信息的度量问题。 信息量: 从统计学的角度来看,信息出现的概率是可以度量的,这个度量就是信息量。 一般而言小概率 ...
分类:
其他好文 时间:
2019-05-31 13:15:23
阅读次数:
210
第一个问题:关于屈服点(屈服强度)和抗拉极限 第二个问题:金属塑性行为的数学模型 第三个问题:有限变形的应力和应变度量 第四个问题:abaqus 中定义塑形 ...
分类:
其他好文 时间:
2019-05-29 23:36:17
阅读次数:
106
在CVPR2019中,Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression介绍了一种新的评价指标GIoU 1. 为什么要提出GIoU? 对于1-IoU作为距离度量,有四个优点:满足非负 ...
分类:
其他好文 时间:
2019-05-25 16:52:59
阅读次数:
249
1.引言 2.算法优劣分析 3.时间复杂度度量方法 4.常见的算法时间复杂度 5.求解时间复杂度的步骤 6.空间复杂度 1.引言 最近没有写博客,一半是比较忙,较大的一半因素是变懒了,日复一日,我觉得有必要重拾起来,坚持一下,为下一个目标做些事情。 2.算法优劣分析 两个方面 2.1 从数学上证明算 ...
分类:
其他好文 时间:
2019-05-25 09:49:22
阅读次数:
118