码迷,mamicode.com
首页 > 其他好文 > 详细

soup.select的用法

时间:2019-12-11 23:31:16      阅读:316      评论:0      收藏:0      [点我收藏+]

标签:div   sharp   add   example   extra   cells   contain   节点   sso   

1、通过标签选择

# 选择所有title标签
soup.select("title")
# 选择所有p标签中的第三个标签
soup.select("p:nth-of-type(3)") 相当于soup.select(p)[2]
# 选择body标签下的所有a标签
soup.select("body a")
# 选择body标签下的直接a子标签
soup.select("body > a")
# 选择id=link1后的所有兄弟节点标签
soup.select("#link1 ~ .mysis")
# 选择id=link1后的下一个兄弟节点标签
soup.select("#link1 + .mysis")

  2、通过类名查找

# 选择a标签,其类属性为mysis的标签
soup.select("a.mysis")

  

  3、通过id查找

# 选择a标签,其id属性为link1的标签
soup.select("a#link1")

  

  4、通过【属性】查找,当然也适用于class

# 选择a标签,其属性中存在myname的所有标签
soup.select("a[myname]")
# 选择a标签,其属性href=http://example.com/lacie的所有标签
soup.select("a[href=‘http://example.com/lacie‘]")
# 选择a标签,其href属性以http开头
soup.select(‘a[href^="http"]‘)
# 选择a标签,其href属性以lacie结尾
soup.select(‘a[href$="lacie"]‘)
# 选择a标签,其href属性包含.com
soup.select(‘a[href*=".com"]‘)
# 从html中排除某标签,此时soup中不再有script标签
[s.extract() for s in soup(‘script‘)]
# 如果想排除多个呢
[s.extract() for s in soup([‘script‘,‘fram‘]

  

1、通过标签选择

1
2
3
4
5
6
7
8
9
10
11
12
# 选择所有title标签
soup.select("title")
# 选择所有p标签中的第三个标签
soup.select("p:nth-of-type(3)") 相当于soup.select(p)[2]
# 选择body标签下的所有a标签
soup.select("body a")
# 选择body标签下的直接a子标签
soup.select("body > a")
# 选择id=link1后的所有兄弟节点标签
soup.select("#link1 ~ .mysis")
# 选择id=link1后的下一个兄弟节点标签
soup.select("#link1 + .mysis")

  2、通过类名查找

1
2
# 选择a标签,其类属性为mysis的标签
soup.select("a.mysis")

  3、通过id查找

1
2
# 选择a标签,其id属性为link1的标签
soup.select("a#link1")

  4、通过【属性】查找,当然也适用于class

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 选择a标签,其属性中存在myname的所有标签
soup.select("a[myname]")
# 选择a标签,其属性href=http://example.com/lacie的所有标签
soup.select("a[href=‘http://example.com/lacie‘]")
# 选择a标签,其href属性以http开头
soup.select(‘a[href^="http"]‘)
# 选择a标签,其href属性以lacie结尾
soup.select(‘a[href$="lacie"]‘)
# 选择a标签,其href属性包含.com
soup.select(‘a[href*=".com"]‘)
# 从html中排除某标签,此时soup中不再有script标签
[s.extract() for s in soup(‘script‘)]
# 如果想排除多个呢
[s.extract() for s in soup([‘script‘,‘fram‘]

soup.select的用法

标签:div   sharp   add   example   extra   cells   contain   节点   sso   

原文地址:https://www.cnblogs.com/jontyfan/p/12026436.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!