1. 廖雪峰Python3教程 2. 汪海的实验室:Python爬虫入门教程 3. 静觅: Python爬虫学习系列教程 ...
分类:
编程语言 时间:
2017-05-13 11:25:58
阅读次数:
145
Python爬虫学习系列教程 | 静觅 http://cuiqingcai.com/1052.html 廖雪峰的官方网站 http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001386 ...
分类:
编程语言 时间:
2017-05-12 20:20:08
阅读次数:
106
1.安装selenium 2.安装phantomjs 下载地址:http://phantomjs.org/download.html 下载的版本是:phantomjs-2.1.1-linux-x86_64.tar.bz2 解压下载好的文件,并把文件夹移动到/usr/local目录下 在/etc/pr ...
分类:
编程语言 时间:
2017-05-01 16:01:22
阅读次数:
224
1. 语法入门 Python教程 2. 爬虫学习系列教程 1)宁哥的小站 2)Python爬虫开发 3)Python爬虫学习系列教程 ...
分类:
编程语言 时间:
2017-04-28 10:22:58
阅读次数:
181
Python爬虫学习系列教程 Python爬虫学习系列教程 大家好哈,我呢最近在学习Python爬虫,感觉非常有意思,真的让生活可以方便很多。学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫,在这里跟大家一同分享,希望对Python爬虫感兴趣的童鞋有帮助,如果有机会期待与大家 ...
分类:
编程语言 时间:
2017-03-01 20:47:38
阅读次数:
202
基于python2.7 get与post: 开发者工具中form表单的method选项为post,那么必须使用post方法。 urllib: 拼接链接格式 urllib2: ...
分类:
编程语言 时间:
2017-01-19 19:50:32
阅读次数:
194
通过GET请求获取返回的网页,其中加入了User-agent信息,不然会抛出"HTTP Error 403: Forbidden"异常, 因为有些网站为了防止这种没有User-agent信息的访问,会验证请求信息中的UserAgent(它的信息包括硬件平台、系统软件、应用软件和用户个人偏好),如果U ...
分类:
编程语言 时间:
2017-01-12 19:02:57
阅读次数:
222
上一节中我们学习了selenium,用python来操作浏览器,在做网页自动化测试的时候最好不过了 。如果我们来做爬虫用一个带界面的浏览器似乎不太好吧,那可咋办呢?别着急,下来我们要介绍的就是一款不带界面的浏览器--PhantomJS。其是一个无界面的,可脚本编程的WebKit浏览器引擎,支持多种w ...
分类:
编程语言 时间:
2016-11-23 16:24:24
阅读次数:
392
1 简介以及安装 Selenium 是什么?一句话,自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,如果你在这些浏览器里面安装一个 Selenium 的插件,那么便可以方便地实现Web界面的测试。换句话说叫 Selenium 支持这些浏览器驱动 ...
分类:
编程语言 时间:
2016-11-22 23:43:39
阅读次数:
790
恢复内容开始 #python2 import urllib2 #python3 import urllib.request html=urllib.request.urlopen('http://www.sogou.com')print (html) #<http.client.HTTPRespon ...
分类:
编程语言 时间:
2016-11-12 22:30:28
阅读次数:
164