关于SQLiteSQLite是一个轻量的、跨平台的、开源的数据库引擎,它的在读写效率、消耗总量、延迟时间和整体简单性上具有的优越性,使其成为移动平台数据库的最佳解决方案(如iOS、Android)。然而免费版的SQLite有一个致命缺点:不支持加密。这就导致存储在SQLite中的数据可以被任何人用任...
分类:
数据库 时间:
2014-05-26 07:12:58
阅读次数:
346
simhash与重复信息识别在工作学习中,我往往感叹数学奇迹般的解决一些貌似不可能完成的任务,并且十分希望将这种喜悦分享给大家,就好比说:“老婆,出来看上帝”……
随着信息爆炸时代的来临,互联网上充斥着着大量的近重复信息,有效地识别它们是一个很有意义的课题。例如,对于搜索引擎的爬虫系统来说,收录重复...
分类:
其他好文 时间:
2014-05-26 06:38:50
阅读次数:
258
详细可参考
(1)书箱:《这就是搜索引擎》《自己动手写网络爬虫》《解密搜索引擎打桩实践》
(2)【搜索引擎基础知识1】搜索引擎的技术架构
(3)【搜索引擎基础知识2】网络爬虫的介绍
1、...
分类:
其他好文 时间:
2014-05-26 05:45:24
阅读次数:
266
通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件。
1. 网络爬虫本质就是浏览器http请求。
浏览器和网络爬虫是两种不同的网络客户端,都以相同的方式来获取网页:
1)首先, 客户端程序连接到域名系统...
分类:
其他好文 时间:
2014-05-26 05:26:52
阅读次数:
358
Schemaless and StructurelessGraph Querying摘要
1. 摘要
由于图数据库的复杂模式和不同的信息描述方式,对于非专业用户来说查询复杂的图数据库是异常困难的。一个好的图查询引擎应该支持多种转化——同义词、缩略词、简写以及本体等等,并且应该能够对搜索结果进行一个很好地排序。
基于此问题本文提出了一种新型的查询框架来方便用户查询,解放了为构造查询图而抓耳挠腮...
分类:
数据库 时间:
2014-05-26 03:45:34
阅读次数:
335
在解决方案找到TestCpp项目,打开其属性=》C/C++ =》预处理器==》预处理器定义, 添加“CC_ENABLE_BOX2D_INTEGRATION=1”, 修改“CC_ENABLE_CHIPMUNK_INTEGRATION=0”, 打开libExtensions项目同样找到预处理器定义, 添加“CC_ENABLE_BOX2D_INTEGRATION=1” , 删除“CC_ENABLE_CH...
分类:
其他好文 时间:
2014-05-26 03:37:38
阅读次数:
242
第一次接触SEO,请阅读本基础指南入门,也可以注册论坛:从一句话入门SEO开始 已经意识到SEO的重要性,渴望系统掌握并与行业精英们深入交流你可以:加入SEOWHY成为VIP会员
什么是SEO,SEO是什么意思?
SEO的中文意思是搜索引擎优化。通俗理解是:通过总结搜索引擎的排名规律,对网站进行合理优化,使你...
分类:
其他好文 时间:
2014-05-24 22:22:21
阅读次数:
406
(一)搜索引擎的开发一般可分为以下三大部分
1、数据采集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi
2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene
3、视图层:也用户的交互界面,如一个网站的首页
其基本架构可参考下图:...
分类:
其他好文 时间:
2014-05-24 22:20:16
阅读次数:
349
模板引擎是用于把模板文件和数据内容合并在一起的程序,便于网站开发有利于代码分离和维护,了解一个模板最好知道其工作原理,以便于实现一通万通。模板文件一般是HTML
xml js等类型文件,如果不用模板引擎若要把数据显示在网页上,我们需要在php中输出HTML,而使用模板则只要把数据交给模板引擎程序即可...
分类:
其他好文 时间:
2014-05-24 14:12:16
阅读次数:
323
Cocos2d-x 3.0新引擎文件夹结构2014年4月29日 Cocos2d-x
3.0学习作为一个Cocos2d-x的菜鸟,我倒是挺愿意关注不同版本号之间的差别,Cocos2d-x
3.0自2013年7月份開始公布alpha0-pre版本号,到2014年4月23日公布正式版,历经9个版本号,总算...
分类:
其他好文 时间:
2014-05-24 09:26:27
阅读次数:
188