码迷,mamicode.com
首页 >  
搜索关键字:bs4    ( 922个结果
selenium+python自动化89-用例不通过的时候发送邮件
前言 实现需求:当测试用例全部通过的时候,不发邮件,当用例出现Error或Failure的时候发送邮件 解决思路:生成html测试报告后,用bs4解析html页面,写个函数判断页面上是都有不通过的记录 html报告 1.查看html报告,主要看Status这一行是否会出现Failure 或 Erro ...
分类:编程语言   时间:2018-01-19 14:10:45    阅读次数:150
股票数据定向爬虫
功能描述 目标:获取上交所和深交所所有股票的名称和交易信息 输出:保存到文件中 技术路线:requests+bs4+re 数据网站的选择 新浪股票:http://finance.sina.com.cn/stock/ 百度股票:https://gupiao.baidu.com/stock/ 选取原则: ...
分类:其他好文   时间:2018-01-19 13:57:23    阅读次数:180
python:re模块
主要是学习re模块的使用,正则表达式的学习...我都看了,就是运用少,所以没记住什么,用到的时候,还得翻我手工记录的正则笔记.....如果是爬取网页,可以用bs4模块,这个更方便,只是正则很强大(~ ̄▽ ̄)~ 看的下面这个文章做得笔记 https://mp.weixin.qq.com/s?__biz ...
分类:编程语言   时间:2018-01-18 23:02:30    阅读次数:215
python爬虫思路
python2爬虫:从网页上采取数据爬虫模块:urllib,urllib2,re,bs4,requests,scrapy,xlml1.urllib2.request3.bs44.正则re5种数据类型(1)数字Number(2)字符串String(3)列表List[]中文在可迭代对象就是unicode对象(4)元组Tuple()(5)字典Set{}爬虫思路:1.静态urlopen打开网页------
分类:编程语言   时间:2018-01-17 00:46:40    阅读次数:200
中国大学排名定向爬虫
功能描述:输入:大学排名URL链接输出:大学排名信息的屏幕输出(排名,大学名称,总分)技术路线:requests+bs4定向爬虫:仅对输入URL进行爬取,不扩展爬取 程序的结构设计:步骤1:从网络上获取大学排名网页内容getHTMLText()步骤2:提取网页内容中信息到合适的数据结构fillUni ...
分类:其他好文   时间:2018-01-13 12:48:36    阅读次数:139
from bs4 import BeautifulSoup 报错
导入BeautifulSoup,出现下面错误: Python 2.7.14 (default, Sep 17 2017, 18:50:44) [GCC 7.2.0] on linux2Type "help", "copyright", "credits" or "license" for more ...
分类:其他好文   时间:2018-01-09 16:45:33    阅读次数:1103
Python网络爬虫与信息提取-Beautiful Soup 库入门
一、Beautiful Soup 库的安装 Win平台:“以管理员身份运行” cmd 执行 pip install beautifulsoup4 安装小测:from bs4 import BeautifulSoup soup=BeautifulSoup('<p>data</p>','html.par ...
分类:编程语言   时间:2018-01-08 01:08:16    阅读次数:198
使用爬虫批量下载图片
import requestsfrom bs4 import BeautifulSoupimport reurl='http://www.quanjing.com/'headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWe... ...
分类:其他好文   时间:2018-01-07 00:46:13    阅读次数:147
Python-利用beautifulsoup写个豆瓣热门图书爬虫
Anaconda3里边自带了bs4的包,省的我自己安装了。 最近觉得模块化的写法可以让代码变得清晰易读。而且随着代码的增多,找bug也会更方便。(目前我还写不出这么多)而且模块化有种工具化的思想,拿来主义的思想在里面,使用工具可是人等少数智慧动物的专利啊。之后也要多学习使用[try - except ...
分类:编程语言   时间:2018-01-04 16:32:03    阅读次数:644
python 未知
import timeimport requestsfrom bs4 import BeautifulSoupimport threadingdef format_str(s): return s.replace("\n","").replace("","").replace("\t",'')def ...
分类:编程语言   时间:2017-12-31 11:56:36    阅读次数:140
922条   上一页 1 ... 60 61 62 63 64 ... 93 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!