标签:树形结构 小知识 网站名 inux 修改 网站 project 功能 文件结构
编写scrapy爬虫的具体流程
最初:分析网站页面需要爬取的结构
第一步:创建scrapy项目:scrapy startproject +文件名
第二步:打开项目
第三步:编写items.py
第四步:创建爬虫文件(基础爬虫文件创建指令:scrapy genspider + 爬虫名 +"网站名")
第五步:编写文件
第六步:编写管道文件(piplines.py)
第七步:修改setting.py文件(设置爬虫文件必须的功能)
小知识点:linux中 tree是树形结构显示文件结构
标签:树形结构 小知识 网站名 inux 修改 网站 project 功能 文件结构
原文地址:http://www.cnblogs.com/mly666/p/7784698.html