SCROT截图工具安装命令 sudo apt-get install
scrot截图命令使用说明:1.抓取整个桌面: scrot ~/Pictures/pic1.jpg2.抓取窗口: scrot -bs
~/Pictures/pic1.jpg3.区域截图: scrot -s ~/Pictures/....
分类:
系统相关 时间:
2014-05-27 01:28:36
阅读次数:
467
在应用程序开发过程中,会遇到很多网络访问问题,自己没有能力提供后台服务,这时就可以抓取网络上的数据包,获取数据接口,应用在程序中。下面介绍使用paros抓取网络数据包得步骤。1.
保证 iphone/android 和电脑在同一个网段2. 在 iphone Setting 设置电脑的 ip 地址 这...
分类:
其他好文 时间:
2014-05-24 03:15:27
阅读次数:
269
http://www.catalogueoflife.org/col/browse/classification这是一个国外的生物信息网站今天的代码可以抓取指定分类的信息(id,学名)没有把多线程写进去,略失败...运用:webclient,regex,io项目在>>>开源中国
1 using Sy...
分类:
其他好文 时间:
2014-05-23 22:08:34
阅读次数:
332
目前很多网站管理者似乎对robots.txt并没有引起多大重视,甚至不知道这么一个文件的作用。本来应该保密的信息被爬虫抓取了,公布在公网上,本应该发布到公网的信息却迟迟不被搜索引擎收录。所以下面这篇文章,就来介绍robots.txt的作用和写作robots.txt基本介绍
robots 是一个...
分类:
其他好文 时间:
2014-05-23 11:03:16
阅读次数:
252
头部代码很重要!错一点都会导致百度抓取出现问题说到代码就要谈到模板了,我相信很多的人也好,企业也好,做的网站都是复制别人的代码居多,这就产生一个问题,模板代码严重相似,特别是经过2013年年底泛站群攻击以后,百度立既改变了算法,把大量相似的代码网站例入垃圾网站,这给一些小网站造成很大的麻烦,每天更新,发外链,比别人复出一倍,排名却仍然停留不前,你有想过是否能从本文找到一些原因吗,如果能给你一些启发...
分类:
其他好文 时间:
2014-05-22 12:11:19
阅读次数:
176
Asp.net 使用正则和网络编程抓取网页数据(实用)...
分类:
Web程序 时间:
2014-05-22 09:21:21
阅读次数:
235
对nutch添加中文网站抓取功能。1、中文网页抓取
A、调整mysql配置,避免存入mysql的中文出现乱码。修改 ${APACHE_NUTCH_HOME}
/runtime/local/conf/gora.properties ################################ .....
分类:
Web程序 时间:
2014-05-19 17:44:52
阅读次数:
326
php中抓取网页拼接url的时候经常需要进行编码,这时候就用到两个函数mb_detect_encoding—检测字符的编码。mb_convert_encoding—转换字符的编码
原文http://cn2.php.net/manual/zh/function.mb-convert-encoding....
分类:
Web程序 时间:
2014-05-19 12:38:26
阅读次数:
300
首先来澄清一下site数据与网站索引量的区别:
1.在搜索引擎中输入site指令后得到的是一个网站大致的收录量。 百度官方给出的说明是:site指令查询到的页面只是放出去的页面,也就是用户可以搜索到的页面。
2.而网站的索引量指的是被编入到索引库中的网页数量(更为精准的收录量)。百度官方给出的解释是:“站点内容页面需要经过搜索引擎的抓取和层层筛选(可以理解为过滤)后,方可在搜索结果中展现给用户...
分类:
其他好文 时间:
2014-05-18 18:41:25
阅读次数:
268
我们发布信息大家都知道,一个好的信息即:看你如何十分好的把要害字融入进入,以及要害字加粗等,可是否晓得为何要这样? 这要从蜘蛛抓取的原理来解释了。
蜘蛛匍匐主要是通过三个过程:
1)匍匐和抓取,
2)预处置,
3)排行。
其间预处置中有一步适当要害,那即是“有关性”。我的了解即是你在查找框中输入要害字,显示出来的页面也即是与这个要害字有关。信息越有关,排行比他人就越靠前,当然这也跟许多的...
分类:
其他好文 时间:
2014-05-18 08:13:21
阅读次数:
127