近来在IT领域最爆炸的新闻莫过于5月20日中央国家机关政府采购中心下发通知,要求中央机关采购所有计算机类产品不允许安装Windows 8,而改用国产Linux操作系统。此消息一出,立刻引起各界关注,那到底是什么原因迫使政府部门做此决定呢?
其实在博主看来,中央做出这个决定的原因很简单,那就是国家信息安全问题。在信息安全越来越重要的今天,随着“棱镜门”、XP停服等事件的爆发,政...
分类:
系统相关 时间:
2014-06-05 04:14:52
阅读次数:
362
Elasticsearch中如何进行CRUD呢?...
分类:
其他好文 时间:
2014-06-05 00:22:29
阅读次数:
274
关于地图的显示,我想大家最关心的就是麻点图,自定义底图的解决方案了吧。在过去,marker大于500之后,浏览器开始逐渐卡死,大家都开始寻找解决方案,比如聚合marker啊,比如麻点图啊。聚合marker里面还有一些复杂的算法,而麻点图,最让大家头疼的,就是如何生成麻点图,如何切图,如何把图片贴到地图上,还有如何定位图片的位置吧。以前那么复杂的一系列操作,居然让云图的可视化操作一下子解决了。现在只...
创建并启动连接器实例之后,连接器就会基于Http协议向指定的数据接收服务器发送xmlfeed格式数据,我们可以通过配置http代理服务器抓取当前基于http协议格式的数据(或者也可以通过其他网络抓包工具抓取)//
设置代理 /Proxy proxy = new Proxy(Pr...
分类:
其他好文 时间:
2014-06-04 14:34:15
阅读次数:
250
今天要研究的问题是如何计算两个文本的相似度。正如上篇文章描述,计算文本的相似度在工程中有着重要的应用,
比如文本去重,搜索引擎网页判重,论文的反抄袭,ACM竞赛中反作弊等等。
上篇文章介绍的SimHash算法是比较优秀的文档判重算法,它能处理海量文本的判重,Google搜索引擎也正是用这
个算法来处理网页的重复问题。实际上,仅拿文本的相似度计算来说,有很多算法都能解决这个问题,并且都达...
分类:
其他好文 时间:
2014-06-02 15:15:39
阅读次数:
200
企业做网络推广关键词设置的几点个人看法 A
如何选择关键词怎样挑选正确的关键词怎样挑选关键词是网络推广中最重要的步骤之中的一个,同一时候也是大多数企业在做网络推广时候easy忽视的问题。都觉得找出几个行业内的热门关键词,将关键词推广到到搜索引擎前几页,就能得到好的推广效果。殊不知此举一般是延误网络推...
分类:
其他好文 时间:
2014-06-02 08:40:42
阅读次数:
198
前言:此文接的是上篇,上次的内容是,用python操作elasticsearch存储,实现数据的插入和查询。估计有些人一看我的标题,以为肯定是logstashkibanaelasticsearch的组合。这三个家伙也确实总是勾搭在一块。其实logstash是可以被别的替换,比如常见的fluented。剩下的那两个,kib..
分类:
其他好文 时间:
2014-06-02 07:50:29
阅读次数:
337
合理的关键字密度散布与黑帽SEO之躲藏文本
咱们都晓得,关于baidu的关键字排行有一个很重要的条件即是关键字密度,在咱们的了解中关键字的密度在2%-8%这个规模之内。咱们想为啥在这个规模之内呢?韶关查找引擎优化今日就跟咱们讨论一下这个关键字密度和用黑帽SEO躲藏文本方面来堆砌关键字取得排行。
网站关键字密度剖析
关于一个正常的网站,他的主页是会有十分多的文字。这儿的文字...
分类:
其他好文 时间:
2014-06-01 18:07:52
阅读次数:
361
前言:例行公事,有些人可能不太了解elasticsearch,下面搜了一段,大家瞅一眼。Elasticsearch是一款分布式搜索引擎,支持在大数据环境中进行实时数据分析。它基于ApacheLucene文本搜索引擎,内部功能通过ReSTAPI暴露给外部。除了通过HTTP直接访问Elasticsearch,还可以通过支..
分类:
编程语言 时间:
2014-06-01 13:47:42
阅读次数:
328
(一)搜索引擎的开发一般可分为下面三大部分1、数据採集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene3、视图层:也用户的交互界面,如一个站点的首页...
分类:
其他好文 时间:
2014-05-31 20:04:37
阅读次数:
263