《9秒小说阅读器》采用免费开源且跨平台的移动应用开发引擎CrossApp开发,是一款完全开源、免费、跨平台的手机小说下载阅读器,基于最宽松的MIT开源协议,所以开发者可以完全免费、毫无顾虑的使用《9秒小说阅读器》在任何商业行为中,也可直接改名后上线运营,官方会提供每天8小时的免费在线页面问答式服务,...
分类:
其他好文 时间:
2014-06-27 20:28:09
阅读次数:
311
hive是一个SQL解析引擎,可以在hive中创建表,执行sql语句。创建的表是存储在hdfs中,执行的sql语句是通过MapReduce执行的。可以通过执行sql语句来代替编写MapReduce作业,太方便了!1.解压缩、设置环境hive使用的版本是hive-0.9.0.tar.gz。我们在/.....
分类:
其他好文 时间:
2014-06-27 19:59:49
阅读次数:
179
数天前,百度站长平台发布“正确理解索引量工具”一文,称索引量仅指被百度搜索引擎建立了索引的网页总量,表示网站中有多少页面可以作为搜索候选结果,不同网页因内容重要性、稀缺性不同,被展现的几率有很大差别。换句话说,既使你的网站有1亿个网页被建立索引,也许真正能获得流量的仅有100个页面。 该文章一经发布...
分类:
Web程序 时间:
2014-06-26 22:47:22
阅读次数:
397
中文分词是做好中文内容检索、文本分析的基础,主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位,而词与词之间并不像英语一样有空格来分隔,因而中文分词的难点在于如何准确而又快速地进行分词以下介绍4款开源中文分词系统。1、ICTCLAS – 全球最受欢迎的汉语分词系统 中文词法分析是中文信息处理...
分类:
其他好文 时间:
2014-06-26 22:35:29
阅读次数:
298
MERGE存储引擎把一组MyISAM数据表当做一个逻辑单元来对待,让我们可以同时对他们进行查询。构成一个MERGE数据表结构的各成员MyISAM数据表必须具有完全一样的结构。每一个成员数据表的数据列必须按照同样的顺序定义同样的名字和类型,索引也必须按照同样的顺序和同样的方式定义。假设你有几个日志数据...
分类:
数据库 时间:
2014-06-26 20:34:11
阅读次数:
287
这学期有门课程老师要求用JAVA实现一个OCR文字识别的程序,所以就花了一些时间研究了一下在安卓端如何实现OCR的引擎是用的开源项目tesseract-ocr这个安卓版的地址:https://code.google.com/p/tesseract-android-tools/但是自己在编译的时候老是...
分类:
移动开发 时间:
2014-06-26 19:51:28
阅读次数:
314
Cocos2d-x v3.1 Hello world程序(四) 在上一篇文章中我们我们已经使用Cocos-Console工具生成了工程,本机生成的目录为:“D:\CocosProject\Tutorial”。我们进入该目录中,如下图: 本篇文章我们将使用Cocos2d-x引擎写一个最简单的工程——“...
分类:
其他好文 时间:
2014-06-26 18:50:36
阅读次数:
253
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。 我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的。我们希望...
分类:
其他好文 时间:
2014-06-26 12:33:39
阅读次数:
197
Rewrite 主要的功能就是实现 URL 的重写,通过重写 URL 实现静态化(当然这是伪静态), 这样做的目的是便于搜索引擎和用户的理解,以提高搜索引擎的收录数量。...
分类:
其他好文 时间:
2014-06-26 12:04:49
阅读次数:
324
垂直搜索引擎研发经验总结
什么是垂直搜索引擎?
垂直搜索引擎是针对某一行业的搜索引擎,是搜索引擎的细化和延伸,是对网页库中的某类信息进行一次整合,定向分字段抽取出所需要的数据,再进行二次处理和索引,最后根据用户提交的请求,返回搜索结果。
与普通的网页搜索引擎相比,它们最大的区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结...
分类:
其他好文 时间:
2014-06-26 07:38:14
阅读次数:
294