爬虫爬取网站信息1 需要用到的库 -requests -bs42 流程 1通过requests发送get请求,这里请求包括url和user-agent 2通过beautifulsoup将response转换成lxml格式 3通过soup.select查找需要的数据,是一个列表的形式,可以同归索引取值 ...
分类:
其他好文 时间:
2018-11-20 13:30:08
阅读次数:
155
import requests,bs4,sys,webbrowser print('It is searching...') res=requests.get('https://so.csdn.net/so/search/s.do?q='+' '.join(sys.argv[1:])) res.ra... ...
分类:
编程语言 时间:
2018-11-19 23:58:31
阅读次数:
439
退役了吗? 退役了…… 但是以后也许还不会一下子离开OI吧 因为我真的很喜欢OI啊 只是实力不如人 为了考上一个学OI的高中 要努力啊! [本题] 一道很好的题目了(刷CF题看到的) 和394A一样,是比较好的 是一个递推 但是是从后往前的 枚举最后一位 for(int i=1; i<10; i++ ...
分类:
其他好文 时间:
2018-11-19 21:31:52
阅读次数:
175
这是一个简约、大气、实用的Hexo新主题:BMW??。 墙内的小伙伴,请移步原文地址: "一款简约且实用的Hexo新主题:BMW" Theme BMW BMW is a beautiful "http://hexo.io" theme. It is created by "https://godbm ...
分类:
其他好文 时间:
2018-11-17 17:51:17
阅读次数:
200
1、简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代 ...
分类:
编程语言 时间:
2018-11-17 14:40:41
阅读次数:
167
667 是很坑爹的一个题目,乍一看和 526 如出一辙, 526. Beautiful Arrangement 题意: 构造 [1,n]的排列,让每个 a[index] % index ==0 或者 index %a[index] ==0, 基本和 46 题一样,就是构造排列。 667题意: 给定两 ...
分类:
其他好文 时间:
2018-11-16 13:28:35
阅读次数:
195
Destroy Walls Long times ago, there are beautiful historic walls in the city. These walls divide the city into many parts of area. Since it was not co ...
分类:
其他好文 时间:
2018-11-15 01:34:25
阅读次数:
159
第一种是看别人博客的,第二种是自己发现的。 第一种: 第二种: 输出结果如下: ...
分类:
Web程序 时间:
2018-11-12 14:46:12
阅读次数:
206
1.Python 爬虫介绍 一、什么是爬虫 爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。 二、Python爬虫架构 Python 爬虫架构主要由五个部分组成,分别是调度器、URL管理器、网页下载器、网页解析器、应用程序(爬取的有价值数据)。 调度器:相当于一台电脑的CPU ...
分类:
编程语言 时间:
2018-11-11 18:00:02
阅读次数:
159
from urllib import request from bs4 import BeautifulSoup as bs #爬取豆瓣最受关注图书榜 resp = request.urlopen('https://book.douban.com/chart?subcat=I') html_data... ...
分类:
其他好文 时间:
2018-11-10 20:10:53
阅读次数:
180