码迷,mamicode.com
首页 > 编程语言 > 详细

一段Python爬虫代码的分析

时间:2020-06-29 13:22:06      阅读:66      评论:0      收藏:0      [点我收藏+]

标签:样式   爬取   open   pre   字符   htm   相关   三方   bsp   

import re
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from openpyxl.styles import Alignment

requests:网页爬取的第三方库 

re:内容解析模块,用于 正则表达式,处理字符串的模块。            

BeautifulSoup=bs4:内容解析,用于提取HTML和XML里的数据。  

通常,Beautiful Soup库的使用:

from bs4 import BeautifulSoup     #主要使用BeautifulSoup类

 一个是库,一个是库里边的类。 

 openpyxl是读写 Excel 文件的 Python 库

workbook:

在刚开始使用openpyxl的时候,不需要直接在文件系统中创建一个文件,仅仅需要导入Workbook类并开始使用它:

from openpyxl import Workbook
wb = Workbook()

openpyxl模块中与字体,颜色,背景,边框,字体,行宽,行高,单元格格式等相关的内容都放在了styles模块中;

styles能够提供的样式有以下几块:

Font:来设置文字的大小,颜色和下划线等

PatternFill:填充图案和渐变色

Border:单元格的边框

Alignment:单元格的对齐方式等

protection:写保护

一段Python爬虫代码的分析

标签:样式   爬取   open   pre   字符   htm   相关   三方   bsp   

原文地址:https://www.cnblogs.com/2016-11-13/p/13203113.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!