1005. Spell It Right (20) 时间限制 400 ms 内存限制 65536 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHEN, Yue 时间限制 400 ms 时间限制 400 ms 内存限制 65536 kB 内存限制 65536 kB 代码长度 ...
分类:
其他好文 时间:
2017-10-04 17:29:51
阅读次数:
170
文本相似性计算三个阶段: 1. 字面的匹配相似 2. 词汇的匹配相似 3. 语义的匹配相似 一、JaccardSimilarity方法 对文本进行分词,然后对每一个单词分配一个唯一的ID(token),为了计算文本之间的相似性。JaccardSimilarity方法的计算方法是: 两个集合的交集/两 ...
分类:
其他好文 时间:
2017-09-30 17:43:25
阅读次数:
190
下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 排除一些无意义词、合并同一词。 对词频统计结果做简单的解读。 ('黛玉', 10)('宝玉', 9)('红楼梦', 4)('落花', 3)('葬花', 3)('黛玉正', 2)('之间' ...
分类:
其他好文 时间:
2017-09-30 00:39:15
阅读次数:
172
中文分词 这是围城第九章时,鸿渐和柔嘉结婚之后的一些矛盾,还有和方老太太之间的一些矛盾和讨论。 ...
分类:
其他好文 时间:
2017-09-29 17:51:06
阅读次数:
145
import jiebafo=open('text.txt','r',encoding='utf-8')t=fo.read()fo.close() words=jieba.cut(t)dic={}for w in words: if len(w)==1: continue else: dic[w]= ...
分类:
其他好文 时间:
2017-09-29 16:44:11
阅读次数:
112
解读:该书的主人公是老人和小孩,讲述的是老人乘船出海捕鱼,最后老人经过几天几夜不屈不挠的斗争终于战胜了大鱼,成功捕获它。 ...
分类:
其他好文 时间:
2017-09-29 14:02:36
阅读次数:
134
下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 排除一些无意义词、合并同一词。 对词频统计结果做简单的解读 ...
分类:
其他好文 时间:
2017-09-29 14:01:17
阅读次数:
167
支持向量机分类器(Support Vector Classifer),根据训练样本的分布,搜索所有可能的线性分类器中最佳的那个。 使用支持向量机分类器处理Scikit-learn内部继承的手写体数字图片数据集。 #coding=UTF-8 ######手写体数据读取代码样例 #从sklearn.da ...
分类:
其他好文 时间:
2017-09-29 11:01:08
阅读次数:
193
在网上看到的关于phantomjs实现截屏功能很多都是与node结合在一起使用,并需要输入命令才能执行。因此我想要实现输入网址即可截屏并输出图片的功能。 一:下载并安装phantomjs 二:装后台集成环境Appserv 三:安装laravel开发框架 三:实现代码及注意事项 1、phantomjs ...
分类:
Web程序 时间:
2017-09-28 20:00:19
阅读次数:
658