码迷,mamicode.com
首页 > 其他好文 > 详细

scrapy学习

时间:2019-03-19 01:18:21      阅读:175      评论:0      收藏:0      [点我收藏+]

标签:rap   http   安装   命令行   执行   ide   .com   mic   check   

 

 

 

 

技术图片 

安装依赖

技术图片

 

基础运用

技术图片

在item中定义一个类(scrapy.Item)来保存 类似于django

技术图片

 

yield返回两种东西,一种是在items中定义好的类 一种是新的请求

css选择器选取的标签

 

 

如果要保存到数据库 或者对数据进行一些处理 在pipeline中进行操作

处理可以返回两种值

技术图片

 

如果要存入数据库

技术图片

 

技术图片

 

 要记得修改pipeline设置

 技术图片

 

命令行命令

scrapy createproject projectName [dir]

开始新项目

 

scrapy genspider name url

创建爬虫

 

scrapy crawl name

执行对应爬虫命令 在class ClassName(scrapy.Spider)中定义类属性name

 

scrapy crawl [name] -o xxxx.json(.jl  .csv .pickle .marshal ftp://user:pass@ftp.example.com/path/xxx.csv)

 

scrapy check 检查是否有错

scrapy list 查看所有爬虫

 

scrapy学习

标签:rap   http   安装   命令行   执行   ide   .com   mic   check   

原文地址:https://www.cnblogs.com/btxlc/p/10556180.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!