码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
POJ-1080 Human Gene Functions---类似LCS
题目链接: https://cn.vjudge.net/problem/POJ-1080 题目大意: 给定两组序列,要你求出它们的最大相似度,每个字母与其他字母或自身和空格对应都有一个打分,求在这两个字符串中插入空格,让这两个字符串的匹配分数最大 解题思路: 类似LCS,以dp[i][j]表示s1前 ...
分类:其他好文   时间:2018-05-08 22:25:30    阅读次数:223
机器学习sklearn19.0聚类算法——Kmeans算法
一、关于聚类及相似度、距离的知识点 二、k-means算法思想与流程 三、sklearn中对于kmeans算法的参数 四、代码示例以及应用的知识点简介 (1)make_blobs:聚类数据生成器 sklearn.datasets.make_blobs(n_samples=100, n_feature ...
分类:编程语言   时间:2018-05-08 14:24:08    阅读次数:1174
推荐系统实践
推荐系统测评 实验方法 离线实验:准备训练数据测试数据并评估; 用户调查:问卷方式、和用户满意度调查 在线实验:AB测试:AB测试是一种很常用的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组, 并对不同组的用户采用不同的算法,然后通过统计不同组用户的各种不同的评测指标比较不同算 法,比如 ...
分类:其他好文   时间:2018-05-06 17:27:54    阅读次数:301
机器学习之聚类
公式实在不好敲呀,我拍了我笔记上的公式部分。原谅自己小学生的字体(太丑了)。 聚类属于无监督学习方法,典型的无监督学习方法还有密度估计和异常检测。 聚类任务:将数据集中的样本划分为若干个不相交的子集,每个子集为一个类。 性能指标(有效性指标):类内相似度高,类间相似度低。 性能度量: (1)外部指标 ...
分类:其他好文   时间:2018-05-06 13:33:44    阅读次数:155
【Pyhton 数据分析】通过gensim进行文本相似度分析
环境描述 Python环境:Python 3.6.1 系统版本:windows7 64bit 文件描述 一共有三个文件,分别是:file_01.txt、file_02.txt、file_03.txt file_01.txt文件内容: 我吃过糖之后,发现我的牙齿真的很疼 file_02.txt文件内容... ...
分类:其他好文   时间:2018-05-06 00:19:47    阅读次数:412
语义相似度(实践篇)
这篇文章,专门讲语义相似度问题。 先看场景: scene(一):用户通过大众点评,线上约了餐馆,就餐后在上面发表了很多评论,评论中涉及了大量的餐馆的问题,比如菜品质量,酒店卫生,服务等等。现在需要抽取之中的要点,然后反馈给商家。 scene(二):KB_QA的两个问题:①获取question的语义表 ...
分类:其他好文   时间:2018-05-01 14:13:03    阅读次数:401
层次聚类
一、Hierarchical Clustering简介 层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。 二、层次聚类的合并算法 假设有 ...
分类:其他好文   时间:2018-04-30 11:59:08    阅读次数:152
LOJ #6041. 事情的相似度
Description 人的一生不仅要靠自我奋斗,还要考虑到历史的行程。 历史的行程可以抽象成一个 01 串,作为一个年纪比较大的人,你希望从历史的行程中获得一些姿势。 你发现在历史的不同时刻,不断的有相同的事情发生。比如,有两个人同时在世纪之交 11 年的时候上台,同样喜欢与洋人谈笑风生,同样提出 ...
分类:其他好文   时间:2018-04-21 19:43:13    阅读次数:330
P1140 相似基因
题目背景 大家都知道,基因可以看作一个碱基对序列。它包含了4种核苷酸,简记作A,C,G,T。生物学家正致力于寻找人类基因的功能,以利用于诊断疾病和发明药物。 在一个人类基因工作组的任务中,生物学家研究的是:两个基因的相似程度。因为这个研究对疾病的治疗有着非同寻常的作用。 题目描述 两个基因的相似度的 ...
分类:其他好文   时间:2018-04-20 13:28:57    阅读次数:154
字符串相似度算法——Levenshtein Distance算法
Levenshtein Distance 算法,又叫 Edit Distance 算法,是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。 算法实现原理图解: a.首先是有 ...
分类:编程语言   时间:2018-04-15 13:41:53    阅读次数:181
854条   上一页 1 ... 27 28 29 30 31 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!