Python 网络爬虫简单分析 我们下面开始分析代码 这里我们利用的是urllib2库中的urlopen方法,这里可以知道这是一个http协议的网址,urlopen一般接受三个参数,它的参数如下: 第一个参数url即为URL,第二个参数data是访问URL时要传送的数据,第三个timeout是设置超 ...
分类:
编程语言 时间:
2016-10-09 13:01:56
阅读次数:
105
一、什么是网络爬虫? 信息时代,每天我们都在上网,每天我们都在浏览器上访问网站,我们打开一个网页,接着又跳转到另一个网页,看到喜欢的内容,或者是一段幽默的句子,或者是一张美女的图片,我们会选择将其保存下来,当数量很多的时候,我们就会选择用程序来实现这样一个过程,实现自动浏览网页,自动根据我们的要求, ...
分类:
其他好文 时间:
2016-10-09 13:01:02
阅读次数:
106
VirtualBox的提供了四种网络接入模式,它们分别是: 1、NAT 网络地址转换模式(NAT,Network Address Translation) 虚拟机访问网络,是通过主机转换的,真实的主机不能访问虚拟机。 2、Bridged Adapter 桥接模式 分配独立的IP地址,可以相互访问。( ...
分类:
其他好文 时间:
2016-10-09 09:07:43
阅读次数:
121
今晚写了一个163邮箱登录的脚本,不知是163登录策略的限制还是163邮箱改版的问题,直接访问163邮箱主页登录需要输入验证码,因为无法获取到验证码,就这导致直接访问主页登录脚本不可行,现在先访问hao123主页,再从主页点击'邮箱'登录。 ...
分类:
编程语言 时间:
2016-10-09 06:58:55
阅读次数:
895
SQLite数据库存储 应用运行需要保存一系列有一定结构的数据, 比如说公司员工信息 文件类型: .db 数据保存的路径: /data/data/projectPackage/databases/xxx.db 默认情况下其它应用不能访问, 当前应用可以通过ContentProvider提供其它应用操 ...
分类:
数据库 时间:
2016-10-09 06:57:42
阅读次数:
297
路由器实现负载均衡:如上图:AR1访问AR3时数据分流走AR2和AR4实现负载均衡AR1配置:[Huawei-GigabitEthernet0/0/0]ipadd1.1.1.128[Huawei-GigabitEthernet0/0/1]ipadd2.2.2.124[Huawei]iproute-static0.0.0.00.0.0.01.1.1.2[Huawei]iproute-static0.0.0.00.0.0.02.2.2.2华为默..
分类:
其他好文 时间:
2016-10-09 01:03:20
阅读次数:
397
我们网站要进行https改造,配置上购买的SSL证书后,浏览器访问正常,但是写了个java代码用httpcomponents调用httpsrest接口时报错:Exceptioninthread"main"javax.net.ssl.SSLHandshakeException:sun.security.validator.ValidatorException:PKIXpathbuildingfailed:sun.securi..
分类:
编程语言 时间:
2016-10-09 00:52:59
阅读次数:
491
linux中是一个很重要的概念,它是指讲设备(已经格式化的分区)挂接到已存在的目录下。linux操作系统将所有的设备都看成一个文件,将所有的资源都整合成为一个很大的目录,如果我们要访问操作系统中的文件,必须将要访问的文件的分区挂,载在一个已存在的目录下,我们通过这个..
分类:
系统相关 时间:
2016-10-09 00:51:27
阅读次数:
242
第8章文件上传漏洞8.1文件上传漏洞概述文件上传漏洞是指用户上传一个可执行的脚本文件,并通过此脚本文件活动执行服务器端的能力。原理:由于文件上传功能实现代码没有严格限制用户上传的文件后缀以及文件类型,导致允许攻击者向某个可通过Web访问的目录上传任意PHP文件。文件..
分类:
Web程序 时间:
2016-10-09 00:49:14
阅读次数:
193
第10章访问控制10.1whatcanido?权限控制是值某个主体(身份)对某一个客体需要实施某种操作,而系统对这种操作的限制就是权限控制。在一个安全系统中,确定主题的身份是“认证”解决的问题;而客体是胭脂红资源,是主题发起的请求对象。在主体对客体进行操作的过程,系统控制主..
分类:
Web程序 时间:
2016-10-09 00:46:37
阅读次数:
158