码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
对【WMD: From Word Embedding to Document Distance】的理解
零、背景简介 Word Embedding可有效表示不同词间的语义相似度(通常用欧式或余弦距离计算),使用BOW(Bag of words)或TF-IDF也能有效表示文档内不同关键词间的距离,但是上述2种方法在表示不同文档间的语义相似性时就显得不那么好用了。因此作者提出基于Word Embeddin ...
分类:其他好文   时间:2020-06-08 00:48:54    阅读次数:59
机器学习之聚类
在无监督学习中,训练样本的标记信息是未知的,目标是通过对无标记的训练样本的学习来揭示数据的内在性质和规律,如数据的聚类特征。聚类试图将数据集中的样本划分为若干个不相交的子集,每个子集称为一个簇。好的聚类结果呈现同一簇的样本尽可能彼此相似,不同簇的样本尽可能不同,换言之,即簇内相似度高且簇间相似度低。 ...
分类:其他好文   时间:2020-06-04 01:48:44    阅读次数:118
用Python选一个自己的股票池2
吾生也有涯,而知也无涯。以有涯随无涯,殆已!入市有风险,投资需谨慎,本文不作为任何投资参考依据。前面通过形态和一些基本面的数据进行了选股,这篇文章就来研究一下相似度选股以及趋势选股吧。相似度我们一般比较在意股票的收盘价,比如均线或者各种指标如果需要计算一段序列值,我们一般选择收盘价作为序列中的值,就像5日均线计算的是五日的收盘价的均值一样。那么每天的收盘价就是一个个数字,一年的收盘价就是一串大概2
分类:编程语言   时间:2020-06-01 10:23:38    阅读次数:98
gluoncv目标检测小结
最近做的项目中,用gluoncv实现了对目标群体打电话的检测。打电话行为检测可以用动作识别,也可以用目标检测,这次我用的是目标检测的方法。大概有以下几个步骤,先大致总结下思路,后续再补充 1、获取数据。 用蜘蛛爬虫从百度图片中爬取了3000+图片 此处有坑。爬虫程序有bug,默认保存时均以jpg结尾 ...
分类:其他好文   时间:2020-05-28 00:45:22    阅读次数:97
商品推荐算法
淘宝网会为你推荐一些商品,而这些商品是如何被推荐过来的想必你也很好奇,今天我们就来聊一下商品推荐的一些算法,当下主流的推荐算法协同过滤推荐算法,让我们一起来看看它是如何工作的。 首先,我们先了解下余弦相似度算法的定义。 其次,大学里我们学过的余弦公式大家应该还有印象,我们先回顾一下。 再者,我们要了 ...
分类:编程语言   时间:2020-05-24 23:45:54    阅读次数:85
RATE-MAX——凡事预则立
RATE MAX——凡事预则立 组长是否重选的议题和结论 因为组长没有被更换,且当前小组内部没有对组长过多得不满和意见,最终得出得结论为由洪楷滨同学继续担任组长。 下一阶段需要改进完善的功能 完善分工参照点:由原本各模块人员继续负责,有较高的相似度,易于完善 前端 管理员界面美化 动态界面美化及加上 ...
分类:其他好文   时间:2020-05-23 00:42:13    阅读次数:63
【selenium学习 -16】对比两个截图的相似度
前面有说过在测试过程中可以截图,截图后,我们可以通过对比截图的相似度,来进行断言 本文介绍两个可以对比截图相似度的方法 方法一: from PIL import Image import math import operator from functools import reduce def im ...
分类:其他好文   时间:2020-05-22 21:38:40    阅读次数:110
聚类算法——DBSCAN算法原理及公式
聚类的定义 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。聚类算法是无监督的算法。 常见的相似度计算方法 闵可夫斯基距离Minkowski/欧式距离 在上述的计算中,当p=1时,则是计算绝对值距离,通常叫做曼哈顿距离,当p ...
分类:数据库   时间:2020-05-20 20:12:09    阅读次数:427
NLP gensim 相似度计算
```pythonfrom collections import defaultdictfrom gensim import corporaimport jiebafrom gensim import similaritiesimport reclass Similarity: def docs(s... ...
分类:其他好文   时间:2020-05-14 01:24:08    阅读次数:55
距离、相似度、相关性度量方法
参考:https://blog.csdn.net/solomonlangrui/article/details/47454805 https://blog.csdn.net/xiao1_1bing/article/details/84788331 本博客主要引用文章如下: 作者:Solomon-La ...
分类:其他好文   时间:2020-05-13 11:47:44    阅读次数:52
854条   上一页 1 2 3 4 5 6 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!