Python 爬虫之下载视频(三)

批量下载某B主视频


文章目录

  • 批量下载某B主视频
  • 前言
  • 一、基本思路
  • 二、确定遍历循环结构
  • 三、基本思路中第12步
  • 三、基本思路中第345步
  • 总结


前言

上一篇讲了如何去获取标题和视频链接。这篇就跟大家讲一下如何去下载这些视频。本篇会以标题和 视频链接 为突破口,来寻找 视频的下载链接 藏在哪里。

注意:分上下两篇来写,请先看Python 爬虫之下载视频(二)。


一、基本思路

  • 第一步:根据上篇找到的视频链接,打开它,会转到一个新的页面。
  • 第二步:新页面刚打开,会弹出登陆窗口,关闭它。
  • 第三步:使用 find 方法查找到视频下载链接的位置。
  • 第四步:使用request.get() 方法去下载该视频。
  • 第五步:用爬到的标题给它们命名保存。

二、确定遍历循环结构

这里要意识到,我们需要将视频的标题和视频链接一一对应起来。这样才能达到理想的效果。

代码如下:

# 遍历地址和标题,让其一一对应起来
i = 0
while i < len(right_url_list):# 视频链接all_url = url_list[i]# 视频标题dirty_name = title_list[i]i += 1

这里我采用的是while循环结构,简单通俗易懂,便于后面的进一步处理。

注意:后面的所有代码都是在while循环结构下写的


三、基本思路中第12步

代码如下:

    # 再一次爬取driver.get(all_url)# 等待网页打开time.sleep(8)# 页面打开会弹出一个登录窗口close = driver.find_element(by=By.CSS_SELECTOR, value='.dy-account-close')# 等登录窗口弹出来time.sleep(5)# 关闭弹出的登录窗口close.click()# 等待网页加载完time.sleep(5)

这里就不多解释了,上一篇有相似的内容。


三、基本思路中第345步

代码如下:

    # 获取视频的下载地址dirty_downloaded_url = driver.find_element(by=By.CSS_SELECTOR, value='video source:nth-child(3)').get_attribute('src')# 下载视频response = requests.get(dirty_downloaded_url, stream=True)total_downloaded = 0chunk_size = 1024with open(f'{dirty_name}.mp4', 'wb') as f:for chunk in response.iter_content(chunk_size=chunk_size):f.write(chunk)print(f'下载完了!!{dirty_name}.mp4')

此处有两个知识点需要大家去学习一下(学完再看上面那几行代码轻轻松松):

一是 driver.find_element(by 相关的知识点。
二是 下载和保存视频的方式的相关的知识点。


总结

此程序是在Python 3.11.6 版本的环境下编写的,注意哦要不然程序可能运行不起来。

运行完上面的程序,就会得到下面的东西。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/293144.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端传输formDate格式的数据,后端不能用@RequestBody接收

写了个接口&#xff0c;跟前端对接&#xff0c;前端说怎么一直415的报错 我寻思不对啊&#xff0c;我swagger都请求成功了&#xff0c;后来发现前端一直是以formdata格式提交的数据&#xff0c;这样我其实是可以不加RequestBody的&#xff1b; 知识点&#xff1a; RequestBody…

工会排队模式:一种创新的消费体验

随着互联网的普及和电子商务的快速发展&#xff0c;消费者对于购物体验的要求也越来越高。为了满足消费者的需求&#xff0c;许多电商平台和商家都在不断探索新的营销模式。其中&#xff0c;工会排队模式就是一种备受关注的新型消费体验模式。 一、工会排队模式的定义 工会排队…

力扣思维题——寻找重复数

题目链接&#xff1a;https://leetcode.cn/problems/find-the-duplicate-number/description/?envTypestudy-plan-v2&envIdtop-100-liked 这题的思维难度较大。一种是利用双指针法进行计算环的起点&#xff0c;这种方法在面试里很难说清楚&#xff0c;也很难想到。大致做…

大数据----33.hbase中的shell文件操作

HBase的命令行工具&#xff0c;最简单的接口&#xff0c;适合HBase管理使用&#xff0c;可以使用shell命令来查询HBase中数据的详细情况。 注意&#xff1a;如果进入hbase后长时间不操作&#xff1b; 发生hbase自动关闭没有了进程&#xff1b; 原因是内存不够&#xff1b;可以关…

STM32的以太网外设+PHY(LAN8720)使用详解(3):PHY寄存器详解

0 工具准备 1.野火 stm32f407霸天虎开发板 2.LAN8720数据手册 3.STM32F4xx中文参考手册1 PHY寄存器 前面介绍到&#xff0c;站管理接口&#xff08;SMI&#xff09;允许应用程序通过2线时钟和数据线访问任意PHY寄存器&#xff0c;同时该接口支持访问最多32个PHY&#xff0c;也…

如果要开发一个小程序一般需要多长时间呢?需要找哪些专业技术人员呢?

如果要开发一个小程序&#xff0c;一般需要多长时间呢&#xff1f; ‍小程序开发的时间通常取决于具体项目的复杂程度和开发人员的经验水平。 以虎克为例&#xff0c;一个简单的小程序&#xff0c;开发周期可能在1个月左右&#xff0c;而复杂度较高的小程序可能需要3个月或更长…

Sui 生态排名第一的头部流动性协议 NAVI Protocol 活动进行中

作为在熊市中启动的新生公链&#xff0c;Sui 正在稳步崛起。公链的 TVL 持续攀升&#xff0c;目前已经达到了 1.76亿美元&#xff0c;闯入了公链排名前20榜单。仅过去四个月内&#xff0c;TVL 增加了10倍&#xff0c;并且增长仍在继续&#xff0c;SUI 的价格在近期也有了很亮眼…

[湖湘杯 2021 final]Penetratable

第一次做到这种题 同样登录框 注册root的时候提示说root已经被注册过了 扫一下看看 访问看看好像也没有什么新的发现 回到登录框&#xff0c;登录抓包 username是base64编码&#xff0c;password也是md5加密的&#xff0c;say也是被base64编码过 经过尝试&#xff0c;注册ad…

深入解析Python装饰器及*args, **kwargs的妙用

深入解析Python装饰器及*args, **kwargs的妙用 简介&#xff1a; ​ 装饰器&#xff08;Decorator&#xff09;是 Python 中一种强大的语法特性&#xff0c;它允许在不修改原始函数代码的情况下&#xff0c;动态地扩展函数的功能。装饰器是函数或类&#xff0c;用于包装其他函…

软文营销的重要性,媒介盒子为你解答

信息茧房环立且用户注意力稀缺的时代下&#xff0c;品牌方唯有在内容上精耕细作才能吸引用户。软文营销能够帮助公司吸引流量&#xff0c;建立与消费者的信任联系&#xff0c;同时增加转化并产生更多的业务。接下来媒介盒子就和大家聊聊&#xff1a;软文营销的重要性。 一、 可…

flutter开发实战-设置bottomNavigationBar中间按钮悬浮效果

flutter开发实战-设置bottomNavigationBar中间按钮悬浮的效果 在使用tabbar时候&#xff0c;可以使用bottomNavigationBar来设置中间凸起的按钮&#xff0c;如下 一、效果图 中间按钮凸起的效果图如下 二、实现代码 我们使用BottomAppBar 一个容器&#xff0c;通常与[Sscaf…

【CMake保姆级教程】制作动静态链接库、指定动静态库输出路径

文章目录 前言一、动静态链接库的介绍1.1 动态链接库 (DLL)1.2 静态链接库 (LIB) 二、制作静态库三、制作动态库四、指定动静态库输出路径4.1 方式1 - 适用于动态库4.2 方式2 - 都适用 总结 前言 在软件开发中&#xff0c;我们经常听到动态链接库&#xff08;Dynamic Link Lib…