码迷,mamicode.com
首页 > 其他好文 > 详细

Scrapy爬虫入门

时间:2018-11-17 14:39:17      阅读:173      评论:0      收藏:0      [点我收藏+]

标签:数据   代码   爬取   html   target   注意   bubuko   匹配   href   

1.安装Scrapy

  打开Anaconda Prompt,执行:pip install Scrapy执行安装!

  注意:要是安装过程中抛出:

  error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

  (或者类似信息)的需要提前安装(根据自己的python版本安装,cp36是指匹配python3.6.x版本,amd64是指64位系统):

  技术分享图片

  下载网站:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

  完成之后执行安装:

  技术分享图片

  安装成功后再执行:pip install Scrapy执行安装即可!

 

2.查看scrapy

  输入:scrapy,表示安装成功!

  技术分享图片

 

3.查看命令

  输入:help

  技术分享图片

  技术分享图片

 

4.创建Scrapy项目

   执行命令:scrapy startproject bky

  技术分享图片

  这表示创建成功!
  执行cd bky, dir命令查看详情:

  技术分享图片

 

5.创建spider

  查看spiders目录

  技术分享图片

  创建一个新的spider,执行命令:scrapy genspider bky_spider "www.cnblogs.cn"

  技术分享图片

  技术分享图片

 

6.执行spider,爬取网页数据

  修改bky_spider.py代码:

  技术分享图片

  技术分享图片

  执行命令:scrapy crawl bky_spider 

技术分享图片

技术分享图片

 

Scrapy爬虫入门

标签:数据   代码   爬取   html   target   注意   bubuko   匹配   href   

原文地址:https://www.cnblogs.com/yszd/p/9973474.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!