码迷,mamicode.com
首页 > 其他好文 > 详细

beautiful soup解析有空格的class

时间:2016-12-02 01:06:32      阅读:321      评论:0      收藏:0      [点我收藏+]

标签:部分   html   空格   参数   pytho   find   相同   过滤器   需要   

用Python写一个爬虫,用BeautifulSoup解析html。
其中一个地方需要抓取下面两类标签:

<dd class="ab " >blabla1</dd>
<dd class="ab cd" >blabla2</dd>

第一类class的值的末尾有一个空格。
第二类class的值中间有一个空格,而且开头部分和第一类相同。

在css中,class的值不应该有空格,所以第一类会忽略空格,第二类会被当做多值属性。参考官方文档多值属性。

所以在处理时也不需再考虑class值中的空格。

传入参数时用列表过滤器是最方便的,如下:

soup.find_all("dd", class_= ["ab", "cd"])

beautiful soup解析有空格的class

标签:部分   html   空格   参数   pytho   find   相同   过滤器   需要   

原文地址:http://www.cnblogs.com/lovely7/p/6123648.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!