pip install selenium python pip升级 第一种 python -m install pip --upgrade pip 第二种 python -m pip install -u --force-reinstall pip 第三种 pip install --user -- ...
分类:
编程语言 时间:
2021-03-05 12:54:23
阅读次数:
0
今天无聊,用php封装了一套比较简单的http请求类 细节方面可以再优化 class Creeper { public $url; public $header; public $text; public $responseHeader; public function __construct($u ...
分类:
Web程序 时间:
2021-03-04 13:21:20
阅读次数:
0
在前端,id是唯一的,只属于一个元素。 在python中,元素定位的方法如下: def find_element_by_id(self, id_): """Finds an element by id. :Args: - id\_ - The id of the element to be foun ...
分类:
其他好文 时间:
2021-03-03 12:29:01
阅读次数:
0
在使用selenium模拟操作时经常遇到一些使用原始方法解决不了的问题。 click失效问题 曾经多次遇到元素click()失败的情况,经典的例子就是某网站的登录框。 一般遇到click失败时我的一般处理方法是改用send_keys(Keys.ENTER),直接用发回车键,简单粗暴。 但是某网站的登 ...
分类:
其他好文 时间:
2021-03-02 11:53:31
阅读次数:
0
接上个文章,因为失败,思考了一下原因,参考了其他的博主。 使用cookie可以免密码登入网站。 所以自动化登录微博首先需要获取已经登录微博后浏览器的cookie。 接下来上代码: # 导入需要的数据包 from selenium import webdriver import time # 将获取的 ...
分类:
其他好文 时间:
2021-03-02 11:42:50
阅读次数:
0
新浪财经是金融新闻类数据挖掘很重要的一个数据来源,它的新闻质量一般都很高。在这里使用爬虫的方法来获取新浪财经的一些新闻资讯。 第一步: 打开新浪财经网站 第二步: 搜索‘工商银行’ 第三步: 获取新浪财经里的‘工商银行’的url url = 'https://search.sina.com.cn/? ...
分类:
其他好文 时间:
2021-03-02 11:42:14
阅读次数:
0
Selenium工具集 如图所示, Selenium工具集的呈现。 1. Selenium IDE Selenium IDE (集成开发环境) 是一个创建测试脚本的工具,如图所示。它是一个FireFox 插件,实现浏览器的录制与回放功能,提供创建自动化测试的建议接口。Selenium IDE 有一个 ...
分类:
其他好文 时间:
2021-03-01 13:58:58
阅读次数:
0
第一部分 分析: 使用selenium获得登陆的cookie,再把cookie传递给requests这种更换请求方式爬取登陆微信公众号平台后的数据,是不行的,所以手动扫码登陆网页的微信公众号平台登陆后,接着使用selenium进行抓取数据等操作(自己分析实践下就知道了) 代码部分: 这里使用Jupy ...
分类:
微信 时间:
2021-03-01 13:22:06
阅读次数:
0
一 布隆过滤器简介 bloomfilter:是一个通过多哈希函数映射到一张表的数据结构,能够快速的判断一个元素在一个集合内是否存在,具有很好的空间和时间效率。(典型例子,爬虫url去重) 原理: BloomFilter 会开辟一个m位的bitArray(位数组),开始所有数据全部置 0 。当一个元素 ...
分类:
其他好文 时间:
2021-03-01 13:19:00
阅读次数:
0
Selenium + TestNG 配置 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSc ...
分类:
Web程序 时间:
2021-02-27 13:24:35
阅读次数:
0