import requests from bs4 import BeautifulSoup import re from datetime import datetime new_list, add, p_list, pa = [], [], [], [] url = 'http://news.gz... ...
分类:
其他好文 时间:
2018-04-03 23:48:25
阅读次数:
188
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。 运行结果如图所示: 2. 分析字符串,获取每篇新闻的发布时间,作者,来源等信息。 运行结果如下: 3. 将其中的发布时间由str转换成datetime类型。 运行结果如图所示: 4. 将完整的代码及运 ...
分类:
其他好文 时间:
2018-04-03 21:57:40
阅读次数:
133
import requestsfrom bs4 import BeautifulSoup url="http://news.gzcc.cn/html/xiaoyuanxinwen/"res=requests.get(url)res.encoding="utf-8" soup=BeautifulSou ...
分类:
其他好文 时间:
2018-04-03 12:54:59
阅读次数:
151
0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( ...
分类:
其他好文 时间:
2018-04-03 12:50:34
阅读次数:
147
import requests from bs4 import BeautifulSoup from datetime import datetime url="http://news.gzcc.cn/html/xiaoyuanxinwen/" res=requests.get(url) res.e... ...
分类:
其他好文 时间:
2018-04-02 13:48:31
阅读次数:
154
import requests from bs4 import BeautifulSoup url = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(url) res.encoding = 'utf-8' soup = B ...
分类:
其他好文 时间:
2018-04-02 13:48:24
阅读次数:
180
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。 import requests from bs4 import BeautifulSoup url="http://news.gzcc.cn/html/xiaoyuanxinwen/" res=req ...
分类:
其他好文 时间:
2018-04-02 13:44:26
阅读次数:
157
1.利用requests.get(url)获取网页页面的html文件 1 2 3 4 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(newsurl) #返回response对 ...
分类:
其他好文 时间:
2018-03-31 22:18:06
阅读次数:
143
专业排名: https://www.dxsbb.com/news/7566.html https://www.dxsbb.com/news/1797.html 34所自主划线: http://www.eol.cn/html/ky/gxmd/34.shtml 考研需知: http://www.kaoy ...
分类:
其他好文 时间:
2018-03-31 13:24:05
阅读次数:
176
0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( ...
分类:
其他好文 时间:
2018-03-30 23:12:53
阅读次数:
191