今天在使用正则表达式时未能解决实际问题,于是使用bs4库完成匹配,通过反复测试,最终解决了实际的问题,加深了对bs4.BeautifulSoup模块的理解。 爬取流程 前奏: 分析糗事百科热图板块的网址,因为要进行翻页爬取内容,所以分析不同页码的网址信息是必要的 具体步骤: 1,获取网页内容(url ...
分类:
编程语言 时间:
2019-02-19 00:54:13
阅读次数:
181
js实现返回顶部效果的解决方案 1、纯js,无动画版本 2、纯js,带动画版本 生硬版: var scrollToTop = window.setInterval(function() { var pos = window.pageYOffset; if ( pos > 0 ) { window.s ...
分类:
其他好文 时间:
2019-02-07 19:11:48
阅读次数:
249
在spring第三篇中介绍了bean元素属性 在第四篇中介绍spring注入的方式 1 set方法注入 建立一个User类 创建私有的属性 set get 方法 重写toString方法 代码如下: package bean; public class User { private String n ...
分类:
编程语言 时间:
2019-02-01 13:09:09
阅读次数:
172
获取元素属性很简单,使用 get_attribute 方法即可 如下图 获取具体的属性直接将该属性名当作参数传入即可 若是获取值,则获取的实则是该元素的 value,需要将 value 当参数传入 运行结果如下: ...
分类:
其他好文 时间:
2019-01-31 20:42:58
阅读次数:
209
Selenium的基本操作 获取浏览器驱动寻找方式 1. 通过手动指定浏览器驱动路径2. 通过 `$PATH`环境变量找寻浏览器驱动 可参考Python学习--Selenium模块简单介绍(1) 控制浏览器访问URLbrowser.get(https://www.baidu.com/) find系列... ...
分类:
编程语言 时间:
2019-01-27 21:34:56
阅读次数:
194
'''size 返回元素的尺寸text 获取元素的文本,测试用例中的断言<a id='cp'>文本信息</a>t_attribute(name) 获取元素属性值is_displayed() 设置该元素是否用户可见''' from selenium import webdriverdriver=web ...
分类:
Web程序 时间:
2019-01-27 14:38:41
阅读次数:
706
$ref的产生原因 (1)重复引用:一个集合/对象中的多个元素/属性都引用了同一个对象 (2)循环引用:集合/对象中的多个元素/属性在相互引用导致循环 针对fastjson的处理 fastjson作为一款序列化引擎,不可避免的会遇到循环引用的问题,为了避免StackOverflowError异常,f ...
分类:
其他好文 时间:
2019-01-25 15:15:23
阅读次数:
401
下面介绍jQuery属性操作: .val() 这是一个读写双用的方法,用来处理input的value,当方法没有参数的时候返回input的value值,当传递了一个参数的时候,方法修改input的value值为参数值。 .attr() .attr(attributeName) 获取元素特定属性的值 ...
分类:
Web程序 时间:
2019-01-17 20:03:14
阅读次数:
185
该部分记录测试页面2-StrategyPage,所有首页上的元素定位、操作、获取属性等方法都写在该类中。 1 首页类继承自BasePage 2 首页类第一部分写的是所有的定位器 3 首页类第二部分类的方法,包括提取页面元素,页面元素的操作、获取属性、验证元素属性正确性等 4 当用例中需要用到该页面的 ...
分类:
编程语言 时间:
2019-01-13 18:07:47
阅读次数:
218
该部分记录测试页面1-IndexPage,所有首页上的元素定位、操作、获取属性等方法都写在该类中。 1 首页类继承自BasePage 2 首页类第一部分写的是所有的定位器 3 首页类第二部分类的方法,包括提取页面元素,页面元素的操作、获取属性、验证元素属性正确性等 4 当用例中需要用到该页面的某元素 ...
分类:
编程语言 时间:
2019-01-13 18:03:07
阅读次数:
318