Scrapy爬虫入门

时间：2018-11-17 14:39:17 阅读：173 评论：0 收藏：0 [点我收藏+]

1.安装Scrapy

　　打开Anaconda Prompt，执行：pip install Scrapy执行安装！

　　注意：要是安装过程中抛出：

　　error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

　　（或者类似信息）的需要提前安装（根据自己的python版本安装，cp36是指匹配python3.6.x版本，amd64是指64位系统）：

　　技术分享图片

　　下载网站：http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

　　完成之后执行安装：

　　技术分享图片

　　安装成功后再执行：pip install Scrapy执行安装即可！

2.查看scrapy

　　输入：scrapy，表示安装成功！

　　技术分享图片

3.查看命令

　　输入：help

　　技术分享图片

4.创建Scrapy项目

　　执行命令：scrapy startproject bky

　　技术分享图片

　　这表示创建成功！
　　执行cd bky, dir命令查看详情：

　　技术分享图片

5.创建spider

　　查看spiders目录

　　技术分享图片

　　创建一个新的spider，执行命令：scrapy genspider bky_spider "www.cnblogs.cn"

　　技术分享图片

6.执行spider，爬取网页数据

　　修改bky_spider.py代码：

　　技术分享图片

　　执行命令：scrapy crawl bky_spider

技术分享图片

Scrapy爬虫入门

标签：数据代码爬取 html target 注意 bubuko 匹配 href

原文地址：https://www.cnblogs.com/yszd/p/9973474.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行