# index_box 提供搜索功能的实现- 持有std::vector<ITEM> _buffer; 存储所有文章信息- 持有ForwardIndex _forward_index; - _forward_index.build_findex( _buffer ) - get_all_items ...
分类:
其他好文 时间:
2017-04-13 08:44:18
阅读次数:
198
# part_indexer 对文章根据id的hash进行分块索引- 持有 search_index _inc_index[2]; search_index _history_index[2]; 进行实际的搜索操作- get_size 调用search_index的search- get_all_i ...
分类:
其他好文 时间:
2017-04-12 09:26:07
阅读次数:
179
Apache Thrift是Facebook实现的一个高效的、支持多种编程语言的远程服务调用(RPC)框架。 Apache Thrift - Homehttp://thrift.apache.org/ centos上安装thrift - 辰羽的视界http://www.1207.me/archive ...
分类:
其他好文 时间:
2017-04-05 10:51:17
阅读次数:
148
可能是CAP理论的最好解释 - 西代零零发 - 博客频道 - CSDN.NEThttp://blog.csdn.net/dc_726/article/details/42784237 CAP理论 - ThinkDiff - 博客园http://www.cnblogs.com/bodhitree/p/ ...
分类:
其他好文 时间:
2017-03-30 10:50:32
阅读次数:
200
你所能犯的最大错误就是相信自己是为别人工作.这样一来你对工作的安全感已然尽失.职业发展的驱动力一定是来自个体本身.记住:工作是属于公司的,而职业生涯却是属于你自己的.-厄尔.南丁格尔
分类:
其他好文 时间:
2017-03-22 23:42:20
阅读次数:
223
有哪些比较好的中文分词方案? - 知乎https://www.zhihu.com/question/19578687 fxsjy/jieba: 结巴中文分词https://github.com/fxsjy/jieba 关键功能与特性:1、中文分词,支持繁体和自定义词典,非win支持并行2、词性标注3 ...
分类:
其他好文 时间:
2017-03-21 12:20:28
阅读次数:
150
K最近邻(k-Nearest Neighbour,KNN)分类算法,是最简单的机器学习算法之一。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。该算法的功能有:从目标区域抽样计算欧式或马氏距 ...
分类:
编程语言 时间:
2017-03-13 10:15:28
阅读次数:
197
键值(Key-Value)存储数据库,这是一种NoSQL(非关系型数据库)模型,其数据按照键值对的形式进行组织、索引和存储。KV存储非常适合不涉及过多数据关系业务关系的业务数据,同时能有效减少读写磁盘的次数,比SQL数据库存储拥有更好的读写性能。kv数据库有leveldb、redis、rocksdb ...
分类:
数据库 时间:
2017-03-08 11:34:34
阅读次数:
224
CGI与FastCGI - wanghetao - 博客园http://www.cnblogs.com/wanghetao/p/3934350.html eddic/fastcgipp: A C++ FastCGI and Web development platform:https://githu ...
分类:
其他好文 时间:
2017-02-28 13:20:33
阅读次数:
182
nginx是由俄罗斯人开发的一种实现web服务器的工具,主要是为俄罗斯的第三大门户网站实现反向代理加速的服务器。 Linux(CentOS)下,下载安装Nginx并配置 - jtlgb - 博客园http://www.cnblogs.com/jtlgb/p/5809808.html 也可以配置源,然 ...
分类:
Web程序 时间:
2017-02-27 13:16:08
阅读次数:
164