基本原理 这节课们们的目的就是使用Requests模块+BeautifulSoup模块爬取网站上的信息 首先爬去一个网站主要分两步 1、第一步我们要了解服务器与本地交换机制,选择正确的办法我们才能获取正确的信息。 2、我们需要了解一些解析真实网页获取信息的一些办法,还有一些思路 我们先讲解一下服务器 ...
分类:
Web程序 时间:
2018-07-05 18:22:50
阅读次数:
229
Python爬虫之使用Fiddler+Postman+Python的requests模块爬取各国国旗 ...
分类:
编程语言 时间:
2018-07-01 22:58:36
阅读次数:
304
杂谈: 之前用requests模块爬取了美女图片,今天用scrapy框架实现了一遍。 (图片尺度确实大了点,但老衲早已无恋红尘,权当观赏哈哈哈) Item: Spider: PipeLine: ...
分类:
编程语言 时间:
2018-06-29 22:23:33
阅读次数:
321
Python3 使用selenium库登陆知乎并保存cookie为本地文件 学习使用selenium库模拟登陆知乎,并将cookie保存为本地文件,然后供以后(requests模块)使用,用selenium模拟登陆时,比较顺利,没有碰到需要验证码的情况,代码放在一个名为cookiesload.py模 ...
分类:
编程语言 时间:
2018-06-27 13:59:11
阅读次数:
481
短信轰炸机的基本原理:利用某些限制不严格的网站短信注册接口,用Python模拟请求,传入被炸人手机号码,实现轰炸 实现方式:利用requests模块、time模块、完成请求模拟 模块安装: 在终端窗口输入 安装requests模块 time模块为内置模块无需安装 此为大体框架,接口需要自己抓取 找到 ...
分类:
编程语言 时间:
2018-06-25 14:58:10
阅读次数:
1386
Window 10家庭中文版,Python 3.6.4, 今天看完了urllib3的官文(官方文档),因为没有具体使用过,所以,仍然是一知半解,但是,突然想知道 urllib3以及前面学习过的requests模块都依赖了什么其它模块。 于是,就有了一段200来行的程序和本文了。 功能名称: 查找Py ...
分类:
编程语言 时间:
2018-06-24 19:36:17
阅读次数:
185
使用时换成具体的url,key和value即可 ...
分类:
编程语言 时间:
2018-06-22 13:34:13
阅读次数:
160
'dev_mac': 'F86CE1E74110''dev_mac': 'F86CE134F960''dev_mac': 'F86CE134F410''dev_mac': 'F86CE134F860''dev_mac': 'F86CE1E7B2E0''dev_mac': 'F86CE1E98B00' ...
分类:
编程语言 时间:
2018-06-20 00:52:59
阅读次数:
326
什么是爬虫? 就是抓取网页数据的程序 爬虫怎么抓取网页数据? 网页三大特征: 网页都有自己唯一的URL。 网页都是HTML来描述页面信息。 网页都使用http/https协议来传输HTML数据。 爬虫的设计思路: 获取视频ID 拼接完整url 获取视频播放地址 下载视频 模块使用 requests ...
分类:
编程语言 时间:
2018-06-16 16:19:31
阅读次数:
175
1.Requests模块的安装 2.selenium + webdriver 模块 安装selenium 1 pip3 install selenium 安装webdriver (chromedriver为例) 1.点击进行下载相对应的版本 当然本地电脑要安装谷歌浏览器 2.解压 然后把.exe 文 ...
分类:
编程语言 时间:
2018-06-09 16:45:36
阅读次数:
195