题意:中文题; 思路:就是找某个点距离其他点的距离,他给你很多点也无所谓。用一个dist【】数组,这个数组保存的是他给你的点到其他点的最短距离且标记的作用,然后bfs搜索就行了。 代码: #include<iostream>#include<algorithm>#include<cstring>#i ...
分类:
其他好文 时间:
2017-12-02 19:07:50
阅读次数:
138
coreseek的安装和使用 准备软件包 coreseek-3.2.14.tar.gz 其他汁源 coreseek中文索引-示例文件.zip sphinx配置文件详解.txt 1.安装组件 yum -y install make gcc g++ gcc-c++ libtool autoconf au ...
分类:
其他好文 时间:
2017-11-04 13:35:41
阅读次数:
288
业务需求 1. 实现搜索引擎前缀搜索功能(中文,拼音前缀查询及简拼前缀查询功能) 2. 实现摘要全文检索功能,及标题加权处理功能(按照标题权值高内容权值相对低的权值分配规则,按照索引的相关性进行排序,列出前20条相关性最高的文章) 前缀搜索 中文搜索: 1. 搜索“刘”,匹配到“刘德华”、“刘斌”、 ...
分类:
其他好文 时间:
2017-10-09 21:06:06
阅读次数:
221
http://jlearning.cn/2017/05/29/ESN-basic-tutorial/ 最近在看回声状态网络(Echo State Network)的内容,注意到中文搜索引擎搜不到关于有关Echo State Network通俗的讲解,打算写一下关于ESN的一个基本教程。本文先用一小段 ...
分类:
其他好文 时间:
2017-10-03 11:25:12
阅读次数:
2505
已经将这篇文章迁移至 Code问答,你也能够到这里查看这篇文章,请多多关注我的新技术博客CodeWenDa.com 在中文搜索中,没有找到一篇比較好的关于怎样在Android应用中使用自己事先创建好的数据库的文章,于是在谷歌上找到这篇英文文章,依照它的步骤,測试成功。决定把这篇文章大致的翻译一下,想 ...
分类:
移动开发 时间:
2017-07-11 23:28:30
阅读次数:
552
搜索引擎的工作过程大体上可以分成三个阶段:1、爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码存入数据库。(1)蜘蛛(2)跟踪链接(3)吸引蜘蛛(4)地址库(5)文件存储(6)爬行时的复制内容检测2、预处理:索引程序对抓取来的页面数据进行文字提娶中文..
分类:
其他好文 时间:
2017-06-21 20:01:10
阅读次数:
154
原文:http://blog.csdn.net/k21325/article/details/53052855 摘要:为解决中文搜索的问题,最开始使用PHP版开源的SCWS,但是处理人名和地名时,会出现截断人名地名出现错误。开始使用NLPIR分词,在分词准确性上效果要比SCWS好。本文介绍如何在wi ...
分类:
编程语言 时间:
2017-06-10 15:16:16
阅读次数:
218
百度的中文搜索非常的好。Google的搜索引擎支持非常多种语言。速度也非常快,据说有8000多台server来支撑搜索。可是有时候域名解析不是特别的稳定。并且我们发现用同一个keyword在不同的搜索引擎里面搜索,搜索的结果可能有天渊之别。那么在我们的工作其中。有没有其它的一些好的经典的搜索引擎,以 ...
分类:
其他好文 时间:
2017-05-27 20:42:04
阅读次数:
153
关于本项目中使用到的庖丁分词的总结: Paoding 详细介绍 庖丁中文分词库是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paodin ...
分类:
编程语言 时间:
2017-05-22 11:59:31
阅读次数:
130
Mmseg中文分词算法解析 @author linjiexing 开发中文搜索和中文词库语义自己主动识别的时候,我採用都是基于mmseg中文分词算法开发的Jcseg开源project。使用场景涉及搜索索引创建时的中文分词、新词发现的中文分词、语义词向量空间构建过程的中文分词和文章特征向量提取前的中文 ...
分类:
编程语言 时间:
2017-05-16 11:00:05
阅读次数:
180