码迷,mamicode.com
首页 > 编程语言 > 详细

Python 3 Anaconda 下爬虫学习与爬虫实践 (2)

时间:2019-03-10 00:04:51      阅读:313      评论:0      收藏:0      [点我收藏+]

标签:关于   odi   parent   info   python   href   requests   实践   div   

下面研究如何让<html>内容更加“友好”的显示

之前略微接触的prettify能为显示增加换行符,提高可阅读性,用法如下:

import requests
from bs4 import BeautifulSoup

r=requests.get("https://www.baidu.com/")
r.encoding=r.apparent_encoding
demo=r.text
soup=BeautifulSoup(demo,"html.parser")
print(soup.prettify())

同样,它也可以为其中的个别标签做专门的处理,比如对a标签进行处理

代码如下:

import requests
from bs4 import BeautifulSoup

r=requests.get("https://www.baidu.com/")
r.encoding=r.apparent_encoding
demo=r.text
soup=BeautifulSoup(demo,"html.parser")
print(soup.a.prettify())

 

 其输出结果如下:

<a class="mnav" href="http://news.baidu.com" name="tj_trnews">
 新闻
</a>

可以发现a标签被清晰的打印了出来

关于bs4库的总结

技术图片

 

Python 3 Anaconda 下爬虫学习与爬虫实践 (2)

标签:关于   odi   parent   info   python   href   requests   实践   div   

原文地址:https://www.cnblogs.com/wangziyan/p/10503575.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!