1. 科普
通用搜索引擎处理的对象是互联网的网页,目前网页的数量数以亿计,所以搜索引擎面临的第一个问题是如何设计出高效的下载系统,已将海量的网页下载到本地,在本地形成互联网网页的镜像。网络爬虫就是担当此大任的。
抓取网页的过程其实和读者平时使用IE浏览器浏览网页的道理是一样的。比如说你在浏...
分类:
编程语言 时间:
2014-05-07 02:41:56
阅读次数:
368
到http://pecl.php.net/package/mongo下载相应的mongodb客户端,本例为1.2.1#
wgethttp://pecl.php.net/get/mongo-1.2.1.tgz# tar xvzf mongo-1.2.1.tgz# cd
mongo-1.2.1# php...
分类:
数据库 时间:
2014-05-07 02:31:15
阅读次数:
394
20140506今天开始学习伟大的开源代表作:Linux内核。之前的工作流于几个简单命令的应用,因着对Android操作系统的情愫,“忍不住”跟随陈利君老师的步伐,开启OS内核之旅。学习路径之一是直接从代码入手,下面来写一个hello.c内核模块。说明:这个路径/usr/src/linux-head...
分类:
系统相关 时间:
2014-05-07 02:12:54
阅读次数:
995
1、linux下等待队列的基本概念
在内核里面,等待队列是有很多用处的,尤其是在中断处理、进程同步、定时等场合。可以使用等待队列在实现阻塞进程的唤醒。它以队列为基础数据结构,与进程调度机制紧密结合,能够用于实现内核中的异步事件通知机制,同步对系统资源的访问等。...
分类:
其他好文 时间:
2014-05-06 21:00:04
阅读次数:
636
findfind命令是我们常用的查找文件的命令,它是一个非常强大的查找指令,但相对话费的时间会很长,并且非常消耗资源。语法:find【路径】【参数】【表达式】【-exec-ok...】指令{}\;{}代表find找到的文件;\禁止转义;{}\;之间是有空格的;;表示本指令结束-execfind命令对匹配..
分类:
系统相关 时间:
2014-05-06 20:57:13
阅读次数:
501
当我们在家目录下运行ls–l命令,会出现一些特别的信息:第一个属性代表这个文件是目录、文件或者是连接文件:d:代表是目录-:代表是文件l:代表是链接文件b:代表是设备文件中可以供存储的接口设备c:代表是设备文件中的串行端口设备,例如键盘等 然后,rwx都是代表?.
分类:
系统相关 时间:
2014-05-06 20:45:08
阅读次数:
646
可以使用python3中的concurrent模块,如果python环境是2.7的话,需要下载https://pypi.python.org/packages/source/f/futures/futures-2.1.6.tar.gz#md5=cfab9ac3cd55d6c7ddd0546a9f22f453此futures包即可食用concurrent模块。官方文档:http://pythonhosted.org//futures/对于..
分类:
编程语言 时间:
2014-05-06 20:22:07
阅读次数:
725
#vim:tabstop=4shiftwidth=4softtabstop=4
#Copyright2010UnitedStatesGovernmentasrepresentedbythe
#AdministratoroftheNationalAeronauticsandSpaceAdministration.
#Copyright2011JustinSantaBarbara
#AllRightsReserved.
#Copyright(c)2010CitrixSystems,Inc.
#
#Licensed..
分类:
数据库 时间:
2014-05-06 20:19:17
阅读次数:
629
Linux/Centos安装ntop中文版一:安装环境yuminstalllibpcaplibpcap-devellibpnggdbmgdbm-develgliblibxml2-develpangopango-develgddos2unixlibtool-ltdllibtool-ltdl-develgcclibtoolrrdtool-devel检测下:yuminstall-ylibpcap*freetype*libpng*gdbm*libart_lgpl*libtool*rrdt..
分类:
其他好文 时间:
2014-05-06 20:09:48
阅读次数:
342