import requests import re from bs4 import BeautifulSoup from datetime import datetime newsurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = reque... ...
分类:
其他好文 时间:
2018-04-08 21:16:09
阅读次数:
150
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5. 生成点击 ...
分类:
其他好文 时间:
2018-04-07 22:45:43
阅读次数:
244
任务如下: 1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5 ...
分类:
其他好文 时间:
2018-04-07 13:54:40
阅读次数:
147
参考帖子 https://www.cnblogs.com/Albert-Lee/p/6232745.html https://www.cnblogs.com/twinsclover/archive/2012/04/26/2471704.html ...
分类:
编程语言 时间:
2018-04-06 18:46:26
阅读次数:
132
在正式爬取之前,先做一个试验,看一下爬取的数据对象的类型是如何转换为列表的: 写一个html文档: 可以看到每个t对象的类型是bs4.element.Tag,也就是标签对象。 那么,如果要从每个t对象中获取a标签的内容,并把所有a标签都保存到一个列表中,该如何做? 可以使用: 接下来就可以正式编写爬 ...
分类:
编程语言 时间:
2018-04-06 14:02:33
阅读次数:
237
虽然BeautifulSoup能帮助我们完成大部分的工作,但是我们还是有必要了解一下正则表达式的产生过程与基本规则的。 在学习正则之前呢,我问了自己几个问题,下面的回答都是我自己的体会或者看别人的文章的启发。 Q : 什么是正则表达式? ** 1、正则表达式(regular expression)描 ...
分类:
其他好文 时间:
2018-04-06 10:59:19
阅读次数:
128
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5. 生成点击 ...
分类:
其他好文 时间:
2018-04-04 23:41:53
阅读次数:
303
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。 2. 分析字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将其中的发布时间由str转换成datetime类型。 4. 将完整的代码及运行结果截图发布在作业上。 ...
分类:
其他好文 时间:
2018-04-04 23:14:11
阅读次数:
180
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。 图片只展示部分 2. 分析字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将其中的发布时间由str转换成datetime类型。 4. 将完整的代码及运行结果截图发布在作业上。 ...
分类:
其他好文 时间:
2018-04-04 23:12:25
阅读次数:
172
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 结果如下: ...
分类:
其他好文 时间:
2018-04-04 21:06:11
阅读次数:
139