from selenium import webdriverimport time def capture(url, save_fn="capture.png"): browser = webdriver.Firefox() # Get local session of firefox bro...
分类:
编程语言 时间:
2015-02-01 14:44:47
阅读次数:
211
做图像处理的朋友,都时常需要收集整理大量的图像数据集。做科研时有各种现有的标准数据集大家都直接拿来用,但是工程上却经常需要自己收集图片,从网上爬取图片便成了比较常见的任务。为了用python完成这个任务,需要解决如下两个问题:
1. 图片素材源自哪里呢?第一直觉就是搜索引擎里的图片,比如要收集手机的图片,则进入搜索引擎搜索关键字即可得到大量相关图片。
2. 动态网站的内容往往是通过aj...
分类:
编程语言 时间:
2015-01-31 00:34:34
阅读次数:
860
上一篇博文介绍了如何用selenium+python在诸如soso、谷歌、好搜等搜索引擎上爬取图片的方法,但是却没用提到百度,因为百度的情况比较特殊。首先,百度图片的数据更好,因为每幅图片都有“data-desc”描述可以作为图像很好的语义标签,此外基于百度较强的技术其查询搜索得到的图片相关性较高,后续人工筛选工作较少;其次,百度图片的数据不容易爬取,如果像前一篇文章中的方法取img标签的src值...
分类:
编程语言 时间:
2015-01-31 00:27:51
阅读次数:
633
case IE :System.setProperty("webdriver.ie.driver","C:\\Program Files\\Internet Explorer\\IEDriverServer.exe");driver = new InternetExplorerDriver();br...
分类:
其他好文 时间:
2015-01-30 19:36:03
阅读次数:
263
我们也可以用xml来定义一个信息更为丰富的UIMap.xml文件,比如,额外还添加控件所属的页,控件的类型,然后解析构建一个XMLParser类来读取相应的值。 1 2 3 6 7 10 相应的解析xml的代码: 1 public static String getLoc...
分类:
其他好文 时间:
2015-01-30 15:43:46
阅读次数:
154
选择浏览器开始测试—Selenium自动化测试指南(2):http://www.blogjava.net/qileilove/archive/2013/08/30/403472.html
分类:
其他好文 时间:
2015-01-29 14:47:49
阅读次数:
142
pythonhttps://www.python.org/python是一种脚本语言, 易学易用,可以助你快速实现业务逻辑,高效集成系统。----- http://zh.wikipedia.org/zh-cn/Python:它的语法简单,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句...
分类:
编程语言 时间:
2015-01-27 00:17:25
阅读次数:
212
Selenium IDE 测试调试是为了发现和修复测试脚本,任何脚本开发的共同步骤是错误的处理。为了使这一过程更加稳固,我们可以使用Selenium IDE的一个插件叫“Power Debugger”Step 1 :安装Selenium IDE的Power Debugger,导航到 https://...
分类:
其他好文 时间:
2015-01-26 15:06:36
阅读次数:
248
Selenium IDE 测试创建涉及使用IDE Selenium创建测试,如下面的步骤记录和测试添加命令保存测试记录保存测试程序执行测试记录在测试中记录和添加命令为了演示目的,我们将利用www.ncalculators.com,了解selenium的特点。步骤 1 :启动Firefox浏览器,然后...
分类:
其他好文 时间:
2015-01-26 15:00:10
阅读次数:
264
Selenium用户扩展这很容易扩展Selenium IDE加入自定义操作,断言和定位,策略,这是通过添加方法,在JavaScript的帮助下Selenium 对象原型。在启动时,Selenium会自动寻找通过这些原型方法,使用名称的模式来识别哪些是行动,断言和定位器。让我们使用JavaScript...
分类:
其他好文 时间:
2015-01-26 14:58:28
阅读次数:
202