标签:数据 文档 project awl size unicode编码 tps 节点 www
一、功能:
BeautifulSoup是用来从HTML或XML中提取数据的Python库。
from bs4 import BeautifulSoup
import bs4
三、编码格式:
soup使用Unicode编码
有四种类型:Tag,NavigableString,BeautifulSoup,Comment。
BeautifulSoup将文档转化为树形结构,每个节点都是上述四种类型的Python对象。
tag属性:name、attrs
参考网址:
1、http://python.jobbole.com/84774/
2、https://www.crummy.com/software/BeautifulSoup/bs4/doc/#making-the-soup
3、http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html
标签:数据 文档 project awl size unicode编码 tps 节点 www
原文地址:http://www.cnblogs.com/nbhhcty66/p/8000310.html