爬虫工作量由小到大的思维转变---<第三十五章 Scrapy 的scrapyd+Gerapy 部署爬虫项目>

前言:

项目框架没有问题大家布好了的话,接着我们就开始部署scrapy项目(没搭好架子的话,看我上文爬虫工作量由小到大的思维转变---<第三十四章 Scrapy 的部署scrapyd+Gerapy>-CSDN博客)

正文:

1.创建主机:

首先gerapy的架子,就相当于部署服务器上的;所以,我们先要连接主机(用户名/密码随你填不填)

----ps:我建议你填一下子,养成习惯;别到时候布到云服务上去了,被人给扫了,那不好玩的!

这里ip就填 127.0.0.1 ,端口6800 --->就是你scrapyd的端口!

创建完成,应该会是这样的:

此时他说你的主机没连接上,为啥?

-----因为这是个基于scrapyd的可视化网页架子,你不开scrapyd服务,他基于啥给你可视化?

所以...

2.开启scrapyd服务

(本地127.0.0.1的不用调设置哈,直接开! 布云端服务器以后会另外说的)

ps:(我这里是拿个项目过来改的,以上一篇爬虫工作量由小到大的思维转变---<第三十四章 Scrapy 的部署scrapyd+Gerapy>-CSDN博客)里面的文件为准; 你哪里装的gerapy和scrapyd,就去那个文件夹;

成功之后,如图:

---你的状态指标,刷新一下:正常!   就是成功了~

3.创建项目文件夹(你也可以自己cmd完成,都随意! 看我原理就成):

特别注意:
  1. log是日志文件夹,你每开启一次gerapy,他就会在里面生成一个日志文件;报错的话,你就去找对应的ERROR看去~ 
  2. gerapy文件夹里也有一个projects文件夹;   他是你装gerapy文件就生成了的; 我目前的版本是gerapy= 0.9.13 ;  这个版本,是在log同级文件里,创建projects(手动创建 mkdir projects)
  3. 如果你的projects创建的层级错了,他会报:

----认真看我说的1 2 3条,还有图! 标红的是极为关键的地方(也就是你丢爬虫工程的地方),搞错了你就丢不上去爬虫工程了~

4.丢爬虫工程:

        1.怎么丢爬虫工程:

                -丢你scrapy的根文件,也就是那个含着"scrapy.cfg"文件的包,全部拷贝!

                

        2.从github上/其他地方拷(后面会讲,这里只谈本地的先带着走一遍)

5.部署到XX服务器(这里是部署本机链接服务):

        步骤1. 你爬虫项目丢的没问题,这个图就没问题!

        步骤2: 打包如果有问题,去看log! 很有可能是坏在setting上---按我步骤,一般不会报错;你就反复去看 '4.丢爬虫工程'那个环节!

        

6.部署成功! 

7.随便玩了

敞开了玩~~ 鼠标点点点,各种乱造...every body 造坏了再来一遍!!吼吼!!!

-----------恭喜大家,部署了自己第一个爬虫项目!  是不是瞬间感觉其他都不香了....

所以我就说嘛.爬虫没意思. 趁早散伙....

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/308768.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Collector收集器的高级用法

Collectors收集器的高级用法 场景1:获取关联的班级名称 原先如果需要通过关联字段拿到其他表的某个字段,只能遍历List匹配获取 for (Student student : studentList) {Long clazzId student.getClazzId();// 遍历班级列表,获取学生对应班级…

超维空间S2无人机使用说明书——51、基础版——使用yolov8进行目标跟踪

引言:为了提高yolo识别的质量,提高了yolo的版本,改用yolov8进行物体识别,同时系统兼容了低版本的yolo,包括基于C的yolov3和yolov4,以及yolov7。 简介,为了提高识别速度,系统采用了G…

数据结构与算法-排序

🌞入冬 时寒 添衣 勿病 要开心 排序 🎈1.排序的基本概念🎈2.排序的分类🔭2.1插入排序🔎2.1.1直接插入排序🔎2.1.2折半插入排序🔎2.1.3希尔排序 🔭2.2交换排序🔎2.2.1冒泡…

07-项目打包 React Hooks

项目打包 项目打包是为了把整个项目都打包成最纯粹的js,让浏览器可以直接执行 打包命令已经在package.json里面定义好了 运行命令:npm run build,执行时间取决于第三方插件的数量以及电脑配置 打包完之后再build文件夹下,这个…

啊?这也算事务?!

作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO 联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬 学习必须往深处挖&…

Spring Boot学习随笔- 集成MyBatis-Plus,第一个MP程序(环境搭建、@TableName、@TableId、@TableField示例)

学习视频:【编程不良人】Mybatis-Plus整合SpringBoot实战教程,提高的你开发效率,后端人员必备! 引言 MyBatis-Plus是一个基于MyBatis的增强工具,旨在简化开发,提高效率。它扩展了MyBatis的功能,提供了许多实用的特性,…

golang第六卷---go命令

go命令 go/go helpgo versiongo envgo buggo buildgo installgo getgo modgo rungo cleango docgo fixgo fmtgo generatego workgo testgo toolgo vet go/go help 通过该命令,我们可以查看go语言中的所有命令,其中go与go help两个命令是等效的 如下&…

实时数仓应用价值(上)

欢迎关注WX公众号:数据运营入表资产化服务 获取更多算法源码材料 2023数据资源入表白皮书,推荐系统源码下载-CSDN博客 浅析研发支出费用化和资本化的区别-CSDN博客 商业银行数据资产估值白皮书,推荐系统源码下载-CSDN博客 用友BIP数据资…

计算机网络【EPoll原理】

预备知识:内核poll钩子原理 内核函数poll_wait 把当前进程加入到驱动里自定义的等待队列上 ; 当驱动事件就绪后,就可以在驱动里自定义的等待队列上唤醒调用poll的进程; 故poll_wait作用:可以让驱动知道事件就绪的时…

笔记1:基于锚框(先验框)的目标检测

一、边缘框(bounding box) 1.1 定义 边缘框:真实标注的物体位置 2.1 表示方式 1、(x1,y1)和(x2,y2) 2、(x1,y1)和w,h 二、锚框(anchor box)/先验框(prior bounding box) 2.1 定义 对边缘…

DDC和PLC的区别

前言 PLC与DDC控制器的比较,一直以来在相关领域内受到广泛关注。每个人站在不同的角度分析,都会有不同的结论,我们今天聊聊这个话题。 基本定义和功能 可编程控制器PLC与直接数字控制器DDC,两者都由CPU模块、I/O模块、显示模块…

Python 内置高阶函数练习(Leetcode500.键盘行)

Python 内置高阶函数练习(Leetcode500.键盘行) 【一】试题 (1)地址: 500. 键盘行 - 力扣(LeetCode) (2)题目 给你一个字符串数组 words ,只返回可以使用在…