协同过滤是通过将用户和其他用户和的数据进行对比来实现推荐。 我们不利用专家所给出的重要属性来描述物品从而计算他们之间的相似度,而是利用用户对他们的意见来计算相似度,这就是协同过滤中所使用的方法。它不关心物品的描述属性,而是严格的按照许多用户的观点来计算相似度。 相似度的度量一种是欧式距离,一种是皮尔 ...
分类:
编程语言 时间:
2018-07-24 21:15:26
阅读次数:
171
一种用于度量聚类效果的指标使SSE(误差平方和),SSE值越小表示数据点越接近于他们的质心,聚类效果也越好。因为对误差取了平方,因此更加重视那些远离中心的点。一种肯定可以降低SSE值的方法是增加簇的个数,但这违背了聚类的目标。聚类的目标是在保持簇数目不变的情况下提高簇的质量 二分 K-均值算法 为克 ...
分类:
其他好文 时间:
2018-07-23 20:50:02
阅读次数:
160
TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。基本应用如: https://blog.csdn.net/blmoistawinde/article/details/80816179 ...
分类:
其他好文 时间:
2018-07-22 23:28:38
阅读次数:
458
http://www.cnblogs.com/fengyan/archive/2012/06/21/2553999.html 谱聚类 给你博客园上若干个博客,让你将它们分成K类,你会怎样做?想必有很多方法,本文要介绍的是其中的一种——谱聚类。 聚类的直观解释是根据样本间相似度,将它们分成不同组。谱聚 ...
分类:
其他好文 时间:
2018-07-21 19:54:29
阅读次数:
173
层次聚类 层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法。 作为一家公司的人力资源部经理 ...
分类:
其他好文 时间:
2018-07-21 12:08:28
阅读次数:
219
概念: 聚类分析(cluster analysis ):是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。聚类分析也叫分类分析,或者数值分类。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或者相似度将其划分成若干个组,划分的原则是组内距离最小化而组间(外部)距离最大化。聚 ...
分类:
编程语言 时间:
2018-07-19 13:45:02
阅读次数:
209
Basic Vector Space Search Engine Theory LA2600– January2, 2004 - presented by Vidiot Overview: A Vector Space Search Engine uses very simple technique ...
分类:
其他好文 时间:
2018-07-17 23:16:53
阅读次数:
224
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习、深度学习的知识!也可以搜索公众号:磐创AI,关注我们的文章。 作者:磐石 简述 图相关的符号符号 相似度矩阵S 拉普拉斯矩阵L性质 谱聚类算法 总结 一、简述 聚类是对探索性数据分析最 ...
分类:
其他好文 时间:
2018-07-15 19:29:51
阅读次数:
198
人脸识别系统,大致可以分成五个部分:人脸检测,质量度量,特征点定位和人脸对齐,人脸特征抽取,相似度度量。 获取到数据后,理所当然需要进行人脸的检测,人脸检测的方法很多,也很容易在网络上找到资源。具体的有:使用Opencv检测人脸,使用dlib库检测人脸,和使用深度学习模型进行检测。其中深度学习方法最 ...
分类:
其他好文 时间:
2018-07-11 19:59:52
阅读次数:
205
Learning to Personalize Query Auto-Completion 样本 正例用用户的sug点击,其余是负例 特征 用户历史特征: query历史频次,候选和用户历史输入的ngram相似度 历史分短期(同一个session),长期(所有历史) 人口特征: 分年龄搜索频次,性别 ...
分类:
其他好文 时间:
2018-07-10 20:11:43
阅读次数:
189