机器学习算法与自然语言处理出品@公众号原创专栏作者刘聪NLP学校|中国药科大学药学信息学硕士知乎专栏|自然语言处理相关论文前几天写了一篇短文本相似度算法研究的文章,不过里面介绍的方法基本上都是基于词向量生成句子向量的方法。今天在这里就介绍一下传统算法TF-IDF是如何计算短文本相似度的。TF-IDF是英文TermFrequency–InverseDocumentFrequency的缩写,中文叫做词
分类:
其他好文 时间:
2020-11-25 12:59:04
阅读次数:
10
SpringBoot与监控 本文只是介绍最基本的使用 1、SpringBootAdmin是什么? Spring Boot Admin 是由 codecentric 组织开发的开源项目,使用 Spring Boot Admin 可以管理和监控你的 Spring Boot 项目。它分为客户端和服务端两部 ...
分类:
编程语言 时间:
2020-11-25 12:30:21
阅读次数:
6
CF1349F1 & 2 [* so hard] 定义好序列为: 所有元素都是正整数。 假设 \(k\ne 1\) 且 \(k\) 在序列中出现过,那么 \(k-1\) 在 \(k\) 最后一次出现的位置之前出现过。 设 \(f_p(i)\) 为 “好序列” \(p\) 中 \(i\) 的出现次数, ...
分类:
其他好文 时间:
2020-11-25 12:03:05
阅读次数:
7
重点 首先注意几个重点: 1. arr1和arr2里最大的元素不会超过1000 2. arr2里面没有重复的元素 3. arr2里面每个元素必定在arr1里面出现 思路 1. 先创建一个大小为1001的数组data用来存放arr1中每个元素出现的次数(因为最大值可能是1000),其实这里可以简化,只 ...
分类:
编程语言 时间:
2020-11-24 13:03:13
阅读次数:
21
2.4 1的数目 基础问题 写一个函数$f(N)$, 返回1到N之间出现的1的个数,比如$f(12) = 5$ 解法 解法1 暴力求解 直接遍历即可 解法2 通过分析小于n的数在每一位上可能出现1的次数之和 // 2.4 1的数目 class Test{ public static void mai ...
分类:
其他好文 时间:
2020-11-23 12:47:11
阅读次数:
19
题目描述: 给定一棵二叉树,你需要计算它的直径长度。一棵二叉树的直径长度是任意两个结点路径长度中的最大值。 这条路径可能穿过也可能不穿过根结点。 分析: 本题和 124. 二叉树中的最大路径和 是一样的思想 ,124 题是在二叉树中 求一条路径 使得这条路径上的 节点和最大。本题是在二叉树树中找一条 ...
分类:
其他好文 时间:
2020-11-21 11:56:08
阅读次数:
3
一·#include<stdio.h> #include<math.h> int main() { float a, b, c, x1, x2; float delta, real, imag; printf("Enter a, b, c: "); while(scanf("%f%f%f", &a, ...
分类:
其他好文 时间:
2020-11-21 11:51:42
阅读次数:
3
1.同步异步 同步:在某一段时间内,依次执行-->并行 异步:在某一时间点上,同时执行-->并发 AJAX:异步的局部刷新技术 2.优缺点 优点: 增强用户体验 因为服务器无需在响应整个页面,只需要响应部分内容所以减轻服务器压力 缺点: ajax不能应用在所有场景 无端的增多了对服务器的访问次数,给 ...
分类:
编程语言 时间:
2020-11-20 11:41:24
阅读次数:
5
Portal 根据结论,冒泡排序交换次数就是逆序对数。 考虑交换 \(l,r\),那么逆序对数会减少一些。显然只需要考虑 \(l/r\) 与 \([l,r]\) 内部元素组成的逆序对的增减,\((l,r)\) 还要去重,不难列出逆序对增加个数(就是减少个数的相反数)的式子: \[ -grt(l,r, ...
分类:
编程语言 时间:
2020-11-20 11:40:10
阅读次数:
6
import jieba txt = open("西游记.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) # 使用精确模式对文本进行分词 counts = {} # 通过键值对的形式存储词语及其出现的次数 for word in ...
分类:
其他好文 时间:
2020-11-20 11:30:40
阅读次数:
32