码迷,mamicode.com
首页 > 编程语言 > 详细

python使用bs4模块 去除html标签字符串方法

时间:2018-12-04 18:57:33      阅读:258      评论:0      收藏:0      [点我收藏+]

标签:text   too   bar   span   target   print   .text   targe   int   

使用bs4模块 去除html标签方法

from bs4 import BeautifulSoup

s = ‘‘‘ 
/usr/sbin/tgt-admin <span class="token comment">#配置工具</span>
/usr/sbin/tgtadm  <span class="token comment">#管理target工具</span>
/usr/sbin/tgtd  <span class="token comment">#服务进程程序</span>
/usr/sbin/tgtimg <span class="token comment">#共享的映射文件设备工具</span></code></pre><div class="toolbar"></div></div>
‘‘‘‘
b = BeautifulSoup(s,"html.parser") #html.parser 是一个固定的值,是一个解析器

print(b.text)

python使用bs4模块 去除html标签字符串方法

标签:text   too   bar   span   target   print   .text   targe   int   

原文地址:http://blog.51cto.com/song1230/2325938

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!