一、介绍 生成器模式是什么呢? 《研磨设计模式中》给了这样的定义:将一个复杂对象的构建与它的表现分离,使得同样的构建过程可以创建不同的表示。 生成器模式的本质——分离整体构建算法和部件构造。 其实,生成器模式的目的,便是为了构建复杂的产品,将构建算法和构造实现分离出来,以便系统可以更好的优化、扩展。 ...
分类:
其他好文 时间:
2019-05-02 09:45:36
阅读次数:
155
1、TF-IDF算法介绍 TF-IDF(term frequency–inverse document frequency,词频-逆向文件频率)是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。 TF-IDF是一种统计方法,用以评估一 ...
分类:
编程语言 时间:
2019-04-23 19:15:58
阅读次数:
230
1. text-rank基于的pagerank: 这个通俗易懂 https://www.letiantian.me/2014-06-10-pagerank/ 这个从矩阵层面讲解 https://zhuanlan.zhihu.com/p/32276862 2.tf-idf: https://zhuan ...
分类:
其他好文 时间:
2019-04-23 12:32:12
阅读次数:
156
一、redis的安装 这里演示的版本是Redis4.0.6,Linux系统是CentOS6.7,Jdk1.7,Jedis2.8.1 这是官方文档介绍的安装方式 下载,解压,编译: $ wget http://download.redis.io/releases/redis-4.0.6.tar.gz ...
分类:
其他好文 时间:
2019-04-20 21:10:20
阅读次数:
183
进入redis的util目录下,拷贝redis_init_script到/etc/init.d/下并重命名为redis 修改CONF,指定配置文件,我的redis配置文件为/etc/redis/redis.conf,之后chmod 777 redis,就可以执行service redis start ...
分类:
其他好文 时间:
2019-04-10 22:05:57
阅读次数:
216
1. 文本向量化特征的不足 在将文本分词并向量化后,我们可以得到词汇表中每个词在各个文本中形成的词向量,比如在文本挖掘预处理之向量化与Hash Trick这篇文章中,我们将下面4个短文本做了词频统计: corpus=["I come to China to travel", "This is a c ...
分类:
其他好文 时间:
2019-04-07 18:07:57
阅读次数:
161
TF-IDF是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。**字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。**即一个词语在一篇文章中出现次数越多, 同时在所 ...
分类:
其他好文 时间:
2019-04-05 18:21:33
阅读次数:
212
题面 "传送门" 设$a$的递推公式为 $$a_i=\sum_ja_jb[count(i\oplus j)]$$ 其中$\oplus$为异或,$count(i)$表示$i$的二进制中$1$的个数 给出$a_0,b$,求$a_t$,$t\leq 10^{18}$ 题解 如果我们定义$c_i=b[cou ...
分类:
其他好文 时间:
2019-03-23 22:42:20
阅读次数:
212
1,错误如图所示 简单说下错误原因是:没有js没有注册进去。 解决方法: 1.看下index.html有没有引入你的js文件。 2.看下app.js有没有注册js,比如我这次就是这步没做好,合并代码时冲掉了。如图 在后面加上丢失的invoidFolder.controllerrjs就好了.希望对别人 ...
分类:
Web程序 时间:
2019-03-06 19:33:06
阅读次数:
388
能干什么? 文章去重,语句去重,提取关键词(文章摘要,页面指纹),图片识别,语音识别 想要做一个相似度,最重要的是什么? 必须得到一个度量:计算个体之间的相似程度(分数,0-1之间,0代表完全不同,一代表完全一样) 相似度值越小,距离越大,相似度值越大,距离越小 两方面考虑: 文本角度 语义角度 例 ...
分类:
其他好文 时间:
2019-03-05 21:34:06
阅读次数:
410