1、索引的管理//指定索引库文件存放文件位置FSDirectory directory = FSDirectory.Open(new DirectoryInfo(this.IndexDataDir), new NativeFSLockFactory());//判断索引文件目录是否存在bool isE...
分类:
Web程序 时间:
2014-08-19 00:51:13
阅读次数:
352
简单对象访问协议(Simple Object Access Protocol,SOAP)是一种基于?XML?的协议,可以和现存的许多因特网协议和格式结合使用,包括超文本传输协议(HTTP),简单邮件传输协议(SMTP),多用途网际邮件扩充协...
分类:
Web程序 时间:
2014-08-18 23:42:23
阅读次数:
536
除了传统对于远程调用的需求,近来移动开发对于api的规范化需要,restful作为一个流行的接口调用方式,值得深入了解。 声明?本文属于转载:原文 此文为实践总结,是自己在实践过程中积累的经验和"哲学"。部分内容...
分类:
其他好文 时间:
2014-08-18 00:23:03
阅读次数:
388
抓取的网页内容中,有大部分会是相似的,抓取时就要过滤掉,开始考虑用VSM算法,后来发现不对,要比较太多东西了,然后就发现了simHash算法,这个算法的解释我就懒得copy了,simhash算法对于短数据的支持不好,但是,我本来就是很长的数据,用上! 源码实现网上也有不少,但是貌似都是同样的,...
分类:
Web程序 时间:
2014-08-17 23:59:23
阅读次数:
709
##总结一## 阅读别人的代码作为开发人员是一件经常要做的事情。一个是学习新的编程语言的时候通过阅读别人的代码是一个最好的学习方法,另外是积累编程经验。如果你有机会阅读一些操作系统的代码会帮助你理解一些...
分类:
其他好文 时间:
2014-08-17 21:28:23
阅读次数:
252
用Jersey构建RESTful服务系列图文。附带项目源码。给力中~...
分类:
其他好文 时间:
2014-08-17 18:34:12
阅读次数:
204
1.solr原理:我本人的理解:solr是为解决高性能的全文索引而出现的,它将用户输入的关键字进行智能分解,分解成一个个词,过滤掉一些多余的停词及空格等,比如,“在”、“里面”、“也”、“的”、“它”、“为”这些词都是停止词。这些词因为使用频率过高,几乎 每个网页上都存在,所以搜索引擎开发人员都将这...
分类:
其他好文 时间:
2014-08-17 18:26:52
阅读次数:
200
RESTful service是一种架构模式,近几年比较流行了,它的轻量级web服务,发挥HTTP协议的原生的GET,PUT,POST,DELETE。 REST模式的Web服务与复杂的SOAP和XML-RPC对比来讲明显的更加简洁,越来越多的web服务开始采用REST风格设计和实现。例如,Amazo...
分类:
其他好文 时间:
2014-08-17 12:56:12
阅读次数:
282
1、 skiplist 巩固skiplist 跳跃表,简单理解是用空间换时间,来实现链表二分查找的数据结构可以用pre、next、blow、above实现四向的链表操作,可以简化search、insert、delete、get等操作时间复杂度:2、 lucene 巩固开源的全文检索引擎框架主要过程:...
分类:
Web程序 时间:
2014-08-17 11:45:02
阅读次数:
256
offset:比如要存储如下词:term,termagancy,termagant,terminal节省存储position:
分类:
其他好文 时间:
2014-08-17 02:27:31
阅读次数:
210