1、//input[contains(@id, 'txttags')] 定位出来是个ID,但是ID后面的“102”是个随机数,所以用定位ID的方法就不行了,用firepath生成的xpath也会包括这个随机数。所以用一种包含关键字的方法定位是比较方便的 2、//input[starts-with(@ ...
分类:
其他好文 时间:
2019-11-16 17:22:43
阅读次数:
128
反爬技术: 1. UA反爬:携带ua,构建有效ua池;2. Ip限制:限制同一ip的访问频率,download_delay =8,代理ip;3. 数据藏在js脚本:一般使用re提取数据;4. ajax请求(动态数据):可以使用selenium或者pypepeer,但是效率太低,影响机器性能, 推荐直 ...
分类:
其他好文 时间:
2019-11-16 12:40:46
阅读次数:
68
目录 selenium 模块 安装 phantomjs 浏览器 安装 chromedriver 接口 安装 对比两个接口 整合使用 基本实例 常用属性方法 定位节点 节点操作 其他操作 实例解析 - 京东商品爬取 实例解析 - 小米应用下载页面爬虫 特殊操作 - 集成 selenium 到Scrap ...
分类:
Web程序 时间:
2019-11-15 20:16:47
阅读次数:
151
参考地址:https://www.cnblogs.com/haojieli/p/6212627.html 1、先来看看效果: 原图 除去干扰像素后 2、解析代码: 1)、读取文件夹里面的图片 2)、获取图片的宽度和高度 3)、循环执行除去干扰像素 按 Ctrl+C 复制代码 按 Ctrl+C 复制代 ...
分类:
编程语言 时间:
2019-11-15 15:49:10
阅读次数:
86
此篇博客学习控制浏览器的api,分别有: get_window_size() 获取浏览器大小 set_window_size() 设置浏览器位置 get_window_position() 获取浏览器在屏幕上的坐标 set_window_position() 设置浏览器在屏幕的位置 maximize ...
分类:
其他好文 时间:
2019-11-15 12:31:52
阅读次数:
66
import time from selenium import webdriver from lxml import etree from selenium.webdriver import ActionChains browser = webdriver.Chrome() # 设置浏览器窗口的位... ...
分类:
Web程序 时间:
2019-11-15 12:29:37
阅读次数:
83
最近在搞单位的项目,实现python自动化,结果在第一步就把我给拒之门外,查资料问大佬,问我们开发人员,从周一折腾到周五才搞定了 接下给大家分享一下 项目背景:我们系统是基于Windows平台实现的,登录方式为Windows身份认证 1、web端登录方式,selenium模块实现 原来想用selen ...
分类:
编程语言 时间:
2019-11-15 12:27:57
阅读次数:
230
一.安装selenium 1.在终端通过命令安装 pip3 install -U selenium 二.准备环境 1.在电脑中安装谷歌浏览器chrom,和下载估计浏览器驱动chromdriver,以下附上驱动下载地址 驱动下载地址:http://npm.taobao.org/mirrors/chro ...
分类:
编程语言 时间:
2019-11-13 17:50:16
阅读次数:
182
基于 selenium 和 unittest 的 Web UI自动化测试框架。 ...
分类:
Web程序 时间:
2019-11-12 23:13:49
阅读次数:
274
"selenum的安装" "selenium文档" 获取微博用户粉丝数 ...
分类:
其他好文 时间:
2019-11-12 12:36:53
阅读次数:
142