1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5. 生成点击 ...
分类:
其他好文 时间:
2018-04-07 22:45:43
阅读次数:
244
任务如下: 1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5 ...
分类:
其他好文 时间:
2018-04-07 13:54:40
阅读次数:
147
按照大牛的步骤简单地爬了豆瓣电影top250.过程感想记录一下。 教程链接:在这里 爬虫写完以后,一直出现错误 出错原因:调用对象是个None,然后调用出错。出错行原本是在第10页没有下一页的链接时候,判断soup.find('span', attrs={'class', 'next'}).find ...
分类:
编程语言 时间:
2018-04-05 23:15:14
阅读次数:
299
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。 2. 分析字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将其中的发布时间由str转换成datetime类型。 4. 将完整的代码及运行结果截图发布在作业上。 ...
分类:
其他好文 时间:
2018-04-04 23:14:11
阅读次数:
180
import requests re=requests.get('http://news.gzcc.cn/html/xiaoyuanxinwen/') re.encoding='utf-8' from bs4 import BeautifulSoup soup = BeautifulSoup(re.... ...
分类:
其他好文 时间:
2018-04-04 16:16:03
阅读次数:
176
Django+xadmin打造在线教育平台(十) 代码 github下载 十四、xadmin的进阶开发 14.1.权限管理 (1)用户权限 超级用户拥有所有权限,其它添加的用户默认没有任何权限 进后台添加一个用户“Editor1”,勾上“职员状态”后,这个用户才可以登录进后台,默认没添加权限的用户登 ...
分类:
其他好文 时间:
2018-04-04 12:32:33
阅读次数:
296
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。 2. 分析字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将其中的发布时间由str转换成datetime类型。 ...
分类:
其他好文 时间:
2018-04-03 22:06:37
阅读次数:
197
import requests from bs4 import BeautifulSoup url = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(url) res.encoding = 'utf-8' soup = B ...
分类:
其他好文 时间:
2018-04-02 13:48:24
阅读次数:
180
1、正则表达式常用符号(1)* 匹配前面的字符、子表达式或括号里的字符0次或多次 例如:a*b* 结果:aaa,aaabb,bb(2)+ 匹配前面的字符、子表达式或括号里的字符至少1次 例如
分类:
编程语言 时间:
2018-03-31 23:07:20
阅读次数:
242