码迷,mamicode.com
首页 > 其他好文 > 详细

scrapyd+gerapy之爬虫部署

时间:2021-07-12 18:17:10      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:初始   配置文件   family   init   本机   image   爬虫   man   super   

一、Linux上安装scrapyd

1. linux下安装python3

可参考我之前博文:https://www.cnblogs.com/Liu928011/p/14864190.html

2. 安装scrapyd并配置软链接

  • 安装scrapyd:pip3 install scrapyd
  • 配置软链接:ln -s /usr/local/python3/bin/scrapyd /usr/bin/scrapyd

 

3. scrapyd默认是只能本机访问,我们需要修改配置,让其能够在外网访问。需要找到配置文件所在目录:

技术图片

 

4. 进入scrapyd的目录

技术图片

 

5. 修改default_scrapyd.conf文件

 技术图片

 

6.vi或vim进入文件修改bind为0.0.0.0

技术图片

 

7. cd到主目录并创建scrapywork目录

技术图片

 

8. 启动scrapyd

技术图片

 

9. 访问成功

技术图片

二、Linux上安装gerapy

ps:gerapy是基于scrapyd创建的,所以,必须保证scrapyd是启动状态

1.安装gerapy:  pip3 install gerapy -i https://pypi.tuna.tsinghua.edu.cn/simple

2.配置软链接:  ln -s /usr/local/python3/bin/gerapy  /usr/bin/gerapy

3. 配置gerapy

(1)创建一个目录

技术图片

 

(2)进入目录,初始化gerapy

gerapy init

技术图片

 

 

(3)迁移生成数据库目录

gerapy makemigrations

 技术图片

 

 

(4)进入gerapy目录

cd gerapy

 技术图片

 

 

(5)数据迁移

gerapy migrate

 技术图片

 

 

(6)创建超级管理员账号

gerapy createsuperuser

技术图片

 

(7)启动服务

gerapy runserver 0.0.0.0:8000

技术图片

 

4、访问

技术图片

 

5、登录账号,创建主机(将项目发布到哪)

技术图片

 

技术图片

 

6、上传项目

技术图片

 

 技术图片

 ...........

scrapyd+gerapy之爬虫部署

标签:初始   配置文件   family   init   本机   image   爬虫   man   super   

原文地址:https://www.cnblogs.com/Liu928011/p/15000047.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!