搜索关键字：BeautifulSoup，搜索到1186个结果！码迷,mamicode.com！

爬取校园新闻首页的新闻的详情，使用正则表达式，函数抽离

import requests import re from bs4 import BeautifulSoup from datetime import datetime newsurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = reque... ...

分类：其他好文时间：2018-04-08 21:16:09 阅读次数：150

爬取校园新闻首页的新闻的详情，使用正则表达式，函数抽离

1. 用requests库和BeautifulSoup库，爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串，获取每篇新闻的发布时间，作者，来源，摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5. 生成点击 ...

分类：其他好文时间：2018-04-07 22:45:43 阅读次数：244

爬取校园新闻首页的新闻的详情，使用正则表达式，函数抽离

任务如下： 1. 用requests库和BeautifulSoup库，爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串，获取每篇新闻的发布时间，作者，来源，摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5 ...

分类：其他好文时间：2018-04-07 13:54:40 阅读次数：147

python模块--Beautifulsoup

参考帖子 https://www.cnblogs.com/Albert-Lee/p/6232745.html https://www.cnblogs.com/twinsclover/archive/2012/04/26/2471704.html ...

分类：编程语言时间：2018-04-06 18:46:26 阅读次数：132

python爬虫学习(二)：定向爬虫例子-->使用BeautifulSoup爬取"软科中国最好大学排名-生源质量排名2018"，并把结果写进txt文件

在正式爬取之前，先做一个试验，看一下爬取的数据对象的类型是如何转换为列表的：写一个html文档: 可以看到每个t对象的类型是bs4.element.Tag，也就是标签对象。那么，如果要从每个t对象中获取a标签的内容，并把所有a标签都保存到一个列表中，该如何做? 可以使用：接下来就可以正式编写爬 ...

分类：编程语言时间：2018-04-06 14:02:33 阅读次数：237

正则表达式——初次尝试

虽然BeautifulSoup能帮助我们完成大部分的工作，但是我们还是有必要了解一下正则表达式的产生过程与基本规则的。在学习正则之前呢，我问了自己几个问题，下面的回答都是我自己的体会或者看别人的文章的启发。 Q : 什么是正则表达式？ ** 1、正则表达式(regular expression)描 ...

分类：其他好文时间：2018-04-06 10:59:19 阅读次数：128

爬取校园新闻

1. 用requests库和BeautifulSoup库，爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串，获取每篇新闻的发布时间，作者，来源，摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5. 生成点击 ...

分类：其他好文时间：2018-04-04 23:41:53 阅读次数：303

爬取校园新闻首页的新闻

1. 用requests库和BeautifulSoup库，爬取校园新闻首页新闻的标题、链接、正文。 2. 分析字符串，获取每篇新闻的发布时间，作者，来源，摄影等信息。 3. 将其中的发布时间由str转换成datetime类型。 4. 将完整的代码及运行结果截图发布在作业上。 ...

分类：其他好文时间：2018-04-04 23:14:11 阅读次数：180

爬取校园新闻首页的新闻

1. 用requests库和BeautifulSoup库，爬取校园新闻首页新闻的标题、链接、正文。图片只展示部分 2. 分析字符串，获取每篇新闻的发布时间，作者，来源，摄影等信息。 3. 将其中的发布时间由str转换成datetime类型。 4. 将完整的代码及运行结果截图发布在作业上。 ...

分类：其他好文时间：2018-04-04 23:12:25 阅读次数：172

爬取校园新闻首页的新闻

1. 用requests库和BeautifulSoup库，爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串，获取每篇新闻的发布时间，作者，来源，摄影等信息。结果如下： ...

分类：其他好文时间：2018-04-04 21:06:11 阅读次数：139