1. 文本向量化特征的不足 在将文本分词并向量化后,我们可以得到词汇表中每个词在各个文本中形成的词向量,比如在文本挖掘预处理之向量化与Hash Trick这篇文章中,我们将下面4个短文本做了词频统计: corpus=["I come to China to travel", "This is a c ...
分类:
其他好文 时间:
2019-04-07 18:07:57
阅读次数:
161
数据结构 去log技巧 可持久化 离线(CDQ分治/整体二分) 偏序转化技巧 记录上一次出现位置 维护值域 树上DFS序 ...
分类:
其他好文 时间:
2019-03-19 16:36:51
阅读次数:
144
Given an array of integers, find the first missing positive integer in linear time and constant space. In other words, find the lowest positive intege ...
分类:
其他好文 时间:
2019-03-08 09:20:26
阅读次数:
120
显然的DP是,dp[i][j][val] val是1e6的 简化 发现,其实决策很有限,最优解的i-1的val选择有限 题解 这里的一个trick是,f[i][j][0]转移不考虑a[i]和a[i-1]的大小关系,如果不计算到j的话,只能更差,而且之后会有一种方案记录到 这样,保留了一种可能的a[i ...
分类:
其他好文 时间:
2019-02-22 23:41:14
阅读次数:
317
这是一篇trick短文,这是一篇不靠谱的hack短文。 系统中有一个数据集,即peer metric,在sysctl中就是: 1 这么一个参数。它包含了任意一个peer的以下字段: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 ...
分类:
其他好文 时间:
2019-02-17 11:01:52
阅读次数:
275
https://blog.csdn.net/left_think/article/details/76370453 1. 背景介绍 在传统的语音识别的模型中,我们对语音模型进行训练之前,往往都要将文本与语音进行严格的对齐操作。这样就有两点不太好: 严格对齐要花费人力、时间。严格对齐之后,模型预测出的 ...
分类:
其他好文 时间:
2019-02-13 11:02:34
阅读次数:
259
"传送门" 思路 是二分图的充要条件:图没有奇环。 考虑按时间分治,用可撤销并查集维护点到根的距离。 仍然可以用一个小trick把两点连边变成根连边,可以看 "这里" 。 每次连边时若不连通则连上,否则判一下有没有奇环。如果有输出“No”,否则不用连。 ~~我tm把T写成m狂WA不止~~ ...
分类:
其他好文 时间:
2019-02-10 00:21:13
阅读次数:
164
A very very very interesting problem ...
分类:
其他好文 时间:
2019-02-08 17:11:24
阅读次数:
127
Running into the same issue here after upgrading from 0.44. None of the above solutions or clearing caches did the trick for me. Here's what I did to ...
分类:
其他好文 时间:
2019-01-28 18:22:18
阅读次数:
209
1.代码实现 2.结果 3.分析 1、AlexNet是比赛分类项目的2012年冠军,top5错误率16.4%,8层神经网络。 2、AlexNet中包含了几个比较新的技术点,首次在CNN中成功应用了Relu、Dropout、 Lrn等Trick。 3、运用Relu,解决Sigmoid在网络层次较深时的 ...
分类:
Web程序 时间:
2019-01-27 12:57:36
阅读次数:
171