码迷,mamicode.com
首页 > 编程语言 > 详细

python学习之爬虫:BeautifulSoup

时间:2017-12-07 21:14:06      阅读:148      评论:0      收藏:0      [点我收藏+]

标签:数据   文档   project   awl   size   unicode编码   tps   节点   www   

一、功能:

BeautifulSoup是用来从HTML或XML中提取数据的Python库。

二、导入:

from bs4 import BeautifulSoup

import bs4

三、编码格式:

soup使用Unicode编码

四、对象种类:

有四种类型:Tag,NavigableString,BeautifulSoup,Comment。
BeautifulSoup将文档转化为树形结构,每个节点都是上述四种类型的Python对象。

 

 

tag属性:name、attrs

 

参考网址:

1、http://python.jobbole.com/84774/

2、https://www.crummy.com/software/BeautifulSoup/bs4/doc/#making-the-soup

3、http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html

python学习之爬虫:BeautifulSoup

标签:数据   文档   project   awl   size   unicode编码   tps   节点   www   

原文地址:http://www.cnblogs.com/nbhhcty66/p/8000310.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!