搜索关键字：news，搜索到2959个结果！码迷,mamicode.com！

爬取校园新闻首页的新闻

import requests from bs4 import BeautifulSoup import re from datetime import datetime new_list, add, p_list, pa = [], [], [], [] url = 'http://news.gz... ...

分类：其他好文时间：2018-04-03 23:48:25 阅读次数：188

爬取校园新闻首页的新闻

1. 用requests库和BeautifulSoup库，爬取校园新闻首页新闻的标题、链接、正文。运行结果如图所示： 2. 分析字符串，获取每篇新闻的发布时间，作者，来源等信息。运行结果如下： 3. 将其中的发布时间由str转换成datetime类型。运行结果如图所示： 4. 将完整的代码及运 ...

分类：其他好文时间：2018-04-03 21:57:40 阅读次数：133

爬取校园新闻首页的新闻

import requestsfrom bs4 import BeautifulSoup url="http://news.gzcc.cn/html/xiaoyuanxinwen/"res=requests.get(url)res.encoding="utf-8" soup=BeautifulSou ...

分类：其他好文时间：2018-04-03 12:54:59 阅读次数：151

网络爬虫基础练习

0.可以新建一个用于练习的html文件，在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( ...

分类：其他好文时间：2018-04-03 12:50:34 阅读次数：147

爬取校园新闻首页的新闻

import requests from bs4 import BeautifulSoup from datetime import datetime url="http://news.gzcc.cn/html/xiaoyuanxinwen/" res=requests.get(url) res.e... ...

分类：其他好文时间：2018-04-02 13:48:31 阅读次数：154

爬取校园新闻首页的新闻

import requests from bs4 import BeautifulSoup url = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(url) res.encoding = 'utf-8' soup = B ...

分类：其他好文时间：2018-04-02 13:48:24 阅读次数：180