基于Scrapyd与Gerapy部署scrapy爬虫方案【可用于分布式爬虫部署】

scrapyd部署爬虫

Scrapyd 是一个基于 Scrapy 的开源项目,它提供了一个简单的方式来部署、运行和监控 Scrapy 爬虫。它是一个用于集成 Scrapy 爬虫到分布式架构中的工具,允许您在分布式环境中运行爬虫,并提供了一组 Web API,用于管理和监控爬虫的部署和运行。
Scrapyd 的主要功能和特点包括:

  1. 部署爬虫: Scrapyd 允许用户将 Scrapy 爬虫部署到远程服务器,而不必手动在每台服务器上安装和配置爬虫。
  2. 运行爬虫: 您可以使用 Scrapyd 启动、停止和监控远程服务器上的爬虫。
  3. Web API: Scrapyd 提供了一组 Web API,使您能够通过 HTTP 请求进行爬虫管理和监控,包括部署新版本、运行爬虫、检查运行状态等。

Scrapyd 对于需要在分布式环境中运行 Scrapy 爬虫的项目非常有用,因为它简化了部署和管理的流程,同时提供了对爬虫状态的监控和控制。

安装与启动部署节点

  1. 安装 Scrapyd:
    首先,您需要确保已经安装了 Python 和 pip。然后使用 pip 安装 Scrapyd:
pip install scrapyd
  1. 启动 Scrapyd 服务器:
    要在服务器上启动 Scrapyd,只需运行以下命令:
scrapyd
  1. 修改默认配置,使scrapyd公开访问【后面部署多台机器需要添加此配置】
    在当前运行目录添加文件scrapyd.conf 文件,写入以下内容
bind_address = 0.0.0.0
http_port = 6800

重新启动,并注意防火墙设置,即可在公开网络内访问到。

Gerapy管理scrapyd节点,部署爬虫

Gerapy 是一个分布式爬虫管理框架,用于帮助开发人员创建、调度和监控爬虫。

  1. 安装 Gerapy: 你可以使用 pip 安装 Gerapy。

    pip install gerapy
    
  2. 初始化工作目录

    gerapy init
    
  3. 初始化数据库

    gerapy migrate
    
  4. 生成管理账号【账号与密码都为admin】

    gerapy initadmin
    
  5. 启动gerapy服务

    gerapy runserver
    
  6. 登录本地8000端口,访问gerapy服务

  7. 点击主机管理右边的创建主机,填写正在运行的scrapyd主机,点击认证与创建,即可链接scrapyd任务节点
    在这里插入图片描述
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/140048.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

信创办公–基于WPS的Word最佳实践系列 (图文环绕方式)

信创办公–基于WPS的Word最佳实践系列 (图文环绕方式) 目录 应用背景操作步骤1、 打开布局选项中图文环绕方式的方法2、 图文环绕三大类型 应用背景 在Word中,对文字和图片进行排版时,采用各种不同的图片与文字组合效果能够使页面…

Windows/Linux系统ftp服务器搭建

文章目录 一、Windows系统ftp服务器搭建二、Linux系统ftp服务器搭建二、安装完成测试 一、Windows系统ftp服务器搭建 系统是2008r2,全图,按照图一步一步点就行了 找个有telnet的电脑测试一下端口,windows的ftp默认端口是21 返回…

汽车屏类产品(二):360全景环视(SVC)、多分割显示、行车记录

前言 随着新能源汽车的快速发展,带动了车载器件的大发展,大的比如域控,小的创新更是不断涌现。而车载显示屏可以说是一大类产品,产品形态也是愈发多样化,比如:仪表cluster、中控IVI、副驾屏、行车记录仪、流媒体后视镜、透明A柱屏、方向盘屏(替代方向盘按键)、门饰板显…

性能测试:测试常见的指标(超详细~)

前言 今天想和大家来聊聊性能测试常见的指标,我在这里也不喜欢说废话我们直接开始吧。 同时,我也为大家准备了一份软件测试视频教程(含面试、接口、自动化、性能测试等),就在下方,需要的可以直接去观看&am…

微信小程序2

一,视图层 1.什么视图层 框架的视图层由 WXML 与 WXSS 编写,由组件来进行展示。 将逻辑层的数据反映成视图,同时将视图层的事件发送给逻辑层。 WXML(WeiXin Markup language) 用于描述页面的结构。 WXS(WeiXin Script) 是小程序的一套脚本语…

ArcGIS笔记8_测量得到的距离单位不是米?一经度一纬度换算为多少米?

本文目录 前言Step 1 遇到测量结果以度为单位的情况Step 2 简单的笨办法转换为以米为单位Step 3 拓展:一经度一纬度换算为多少米 前言 有时我们会遇到这种情况,想在ArcGIS中使用测量工具测量一下某一段距离,但显示的测量结果却是某某度&…

2023年京东洗发护发行业增长趋势分析:头皮清洁或成小风口

如今,随着消费观念的转变,越来越多的消费者愈加重视头部的洗护,无论是女性还是男性,都开始积极寻找头部洗护用品,以更好地呵护头发及头皮。在用户需求的推动下,洗发护发行业已经逐渐发展成为成熟行业。 根据…

青龙面板安装及配置

一、青龙面板安装 二、初始化配置 首次登录需要进行初始化配置 1、开始安装 2、账号设置 3、通知设置 通知方式 - 钉钉机器人 获取钉钉机器人的token和secret参考如下文章: 获取钉钉机器人的token及secret-CSDN博客 4、完成 5、登录 三、应用 待续

QT_day1

#include "mywidget.h"MyWidget::MyWidget(QWidget *parent): QWidget(parent) {//窗口相关设置this->setWindowTitle("登录窗口");this->setWindowIcon(QIcon("C:\\Users\\EDY\\Desktop\\pictrue\\qq.png"));this->setWindowFlag(Qt::…

mysql—表单二

一、查询环境 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR(20) NOT NULL , sex VARCHAR(4) , birth YEAR, department VARCHAR(20) , address VARCHAR(50) ); 创建score表。SQL代码如下: CR…

《视觉 SLAM 十四讲》V2 第 12 讲 建图

文章目录 12.2 单目稠密 重建12.2.2 极线搜索 && 块匹配12.2.3 高斯分布的深度滤波器 12.3 单目稠密重建 【Code】待改进12.3.4 图像间的变换 12.4 RGB-D 稠密建图12.4.1 点云地图 【Code】查询OpenCV版本 opencv_version 12.4.2 从点云 重建 网格 【Code】查看PCL 版本…

使用Python接口自动化测试post请求和get请求,获取请求返回值

引言 我们在做python接口自动化测试时,接口的请求方法有get,post等;get和post请求传参,和获取接口响应数据的方法; 请求接口为Post时,传参方法 我们在使用python中requests库做接口测试时,在做post接口测试…