码迷,mamicode.com
首页 > 编程语言 > 详细

python爬虫使用requests请求无法获取网页元素时终极解决方案

时间:2020-06-14 20:53:53      阅读:155      评论:0      收藏:0      [点我收藏+]

标签:div   cos   内容   png   页面   element   quit   打开百度   tom   

    爬取数据时,有时候会出现无法通过正常的requests请求获取网页内容,导致数据无法抓取到,遇到这种情况时,可以换种思路去爬取数据,使用PhantomJS,即爬虫终极解决方案去获取页面元素。

 

#!/usr/local/bin/python3.7

from selenium import webdriver
import time

# phantomJS路径
path = /Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs
# 创建浏览器对象
browser = webdriver.PhantomJS(path)

# 打开百度并操作
url = https://www.baidu.com
browser.get(url)
time.sleep(1)
# 截图
browser.save_screenshot(Reptile/phantomjs_img/baidu.png)
# 定位搜索框
search = browser.find_element_by_id(kw)
time.sleep(1)
# 在搜索框输入内容
search.send_keys(美女)
time.sleep(1)
# 截图
browser.save_screenshot(Reptile/phantomjs_img/meinv.png)
# 关闭浏览器
browser.quit()

 

python爬虫使用requests请求无法获取网页元素时终极解决方案

标签:div   cos   内容   png   页面   element   quit   打开百度   tom   

原文地址:https://www.cnblogs.com/lxmtx/p/13126534.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!