1. 科普
通用搜索引擎处理的对象是互联网的网页,目前网页的数量数以亿计,所以搜索引擎面临的第一个问题是如何设计出高效的下载系统,已将海量的网页下载到本地,在本地形成互联网网页的镜像。网络爬虫就是担当此大任的。
抓取网页的过程其实和读者平时使用IE浏览器浏览网页的道理是一样的。比如说你在浏...
分类:
编程语言 时间:
2014-05-07 02:41:56
阅读次数:
368
1、异常 例如: def fetcher(obj,index): return obj[index]
def catcher(): ...
分类:
编程语言 时间:
2014-05-07 01:51:04
阅读次数:
460
文件的存储方式: 文件都有自己的存储格式,比如最常见的txt,cpp,h,c,xml
,png, rmvb各种格式,还有自定义格式。这些文件不论是什么格式,都是存储在计算机硬盘里的2进制格存储,对应不同文件格式,有不同的软件解析。这篇文章不谈
文件是如何存储的,只谈文件是如何解析的。 文本文件解析:...
分类:
其他好文 时间:
2014-05-07 01:40:40
阅读次数:
255
(1)pyhton
shell下导入MySQLdb失败。http://pypi.python.org/pypi/MySQL-python/(2)下载解压MySQL-python。http://pypi.python.org/packages/source/M/MySQL-python/MySQL-p...
分类:
数据库 时间:
2014-05-07 01:38:05
阅读次数:
502
新建一个文本文档,打开,输入以下字符Windows Registry Editor
Version
5.00[HKEY_CLASSES_ROOT\*\shell\runas]@="管理员取得所有权""NoWorkingDirectory"=""[HKEY_CLASSES_ROOT\*\shell\r...
分类:
其他好文 时间:
2014-05-07 01:30:55
阅读次数:
312
Ubuntu安装Matplotlibubuntu下安装matplotlib的复杂度远远比windows下复杂的多,相对双击就能解决问题的,现在你需要时不时的解决编译带来的各种问题。1sudo
apt-get install python-dev先安装numpy:12python setup.py b...
分类:
编程语言 时间:
2014-05-07 01:04:09
阅读次数:
606
1、对应的IP2、将打印的文本文件 1 import
java.io.ByteArrayOutputStream; 2 import java.io.File; 3 import
java.io.FileInputStream; 4 import java.io.IOException; 5 imp...
分类:
其他好文 时间:
2014-05-07 01:02:52
阅读次数:
294
分形 逃逸时间算法 广义mandelbrot集,终于绘制出来了,圆了毕业设计的梦...
分类:
编程语言 时间:
2014-05-06 21:21:36
阅读次数:
482
可以使用python3中的concurrent模块,如果python环境是2.7的话,需要下载https://pypi.python.org/packages/source/f/futures/futures-2.1.6.tar.gz#md5=cfab9ac3cd55d6c7ddd0546a9f22f453此futures包即可食用concurrent模块。官方文档:http://pythonhosted.org//futures/对于..
分类:
编程语言 时间:
2014-05-06 20:22:07
阅读次数:
725
#vim:tabstop=4shiftwidth=4softtabstop=4
#Copyright2010UnitedStatesGovernmentasrepresentedbythe
#AdministratoroftheNationalAeronauticsandSpaceAdministration.
#Copyright2011JustinSantaBarbara
#AllRightsReserved.
#Copyright(c)2010CitrixSystems,Inc.
#
#Licensed..
分类:
数据库 时间:
2014-05-06 20:19:17
阅读次数:
629