码迷,mamicode.com
首页 > 其他好文 > 详细

BeautifulSoup模块详细介绍

时间:2019-08-24 00:38:42      阅读:147      评论:0      收藏:0      [点我收藏+]

标签:ring   引擎   定义   jquer   选择器   rap   换行   nbsp   esc   

安装lxml,引擎(解析器)

soup=BeautifulSoup(html_doc,features="lxml")

tag=soup.select(‘#link2‘)  选择器的方式

tag.name  获取标签名

children:儿子 标签和内容是不一样的类型

descendants:后代

clear:清空保留标签名  decompose:删除,不保留标签名

extract:删除并有返回值(删除的标签

encode:把对象转化为字节类型  decode:把对象转化为字符串类型

recursive=True  是否递归去找

soup.find(class_=‘ ‘)  class写在attrs外面要加下划线避免与定义类class关键字冲突

. 是通配符除了换行符 \n

tag.get(‘ id ‘)  获取标签属性

www.cnblogs.com/wupeiqi/articles/6283017.html

is_empty_element  是否空标签或自闭合标签

tag.string  不仅可以获取还能修改,标签内容

创建标签:obj=Tag(name=‘div‘,attrs={‘id‘:‘it‘})

jquery.cuishifeng.cn  jquery方法大全

tag.wrap(obj)  将obj把tag标签包裹起来

tag.unwrap()  去掉当前标签,保留其包裹的标签

技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片技术图片

 

BeautifulSoup模块详细介绍

标签:ring   引擎   定义   jquer   选择器   rap   换行   nbsp   esc   

原文地址:https://www.cnblogs.com/jintian/p/11403120.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!