【python爬虫】—图片爬取-编程知识

【python爬虫】—图片爬取

news/2025/3/17 2:04:06/文章来源:https://blog.csdn.net/qq_38734327/article/details/132586638

图片爬取

- 需求分析
- Python实现

需求分析

从https://pic.netbian.com/4kfengjing/网站爬取图片，并保存

Python实现

获取待爬取网页

def get_htmls(pages=list(range(2, 5))):"""获取待爬取网页"""pages_list = []for page in pages:url = f"https://pic.netbian.com/4kfengjing/index_{page}.html"response = requests.get(url)response.encoding = 'gbk'pages_list.append(response.text)return pages_list
get_htmls(pages=list(range(2, 5)))

获取所有图片，并下载

def get_picturs(htmls):"""获取所有图片，并下载"""for html in htmls:soup = BeautifulSoup(html, 'html.parser')pic_li = soup.find('div', id='main').find('div', class_='slist').find('ul', class_='clearfix')image_path = pic_li.find_all('img')for file in image_path:pic_name = './practice05/' + file['alt'].replace(" ",'_') + '.jpg'src = file['src']src = f"https://pic.netbian.com/{src}"response = requests.get(src)with open(pic_name, 'wb') as f:f.write(response.content)print("图片已下载并保存为:{}".format(pic_name))htmls = get_htmls(pages=list(range(2, 5)))
get_picturs(htmls)

爬取结果展示

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/90394.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Unity 之 Start 与 Awake 的区别

Unity 之 Start 与 Awake 的区别

文章目录在Unity中，Awake和Start都是用于脚本中的生命周期方法，用于控制游戏对象在不同阶段的初始化和行为。它们之间的区别在于调用的时间和用途。 Awake: Awake 是一个在游戏对象被实例化时首先调用的方法。它在对象被加载到场景中但在启用之前调用。…

阅读更多...

亚马逊店铺出新品时，应该注意什么？

亚马逊店铺出新品时，应该注意什么？

要想提升产品销量的话，产品质量不仅要好，同时还需要做好推广宣传，这样单单还不够，还需要做好买家评论。现如今，由于开亚马逊店铺的人越来越多，导致开亚马逊店铺的市场竞争力也变得越来越大，以…

阅读更多...

十年测试工程师叙述自动化测试学习思路

十年测试工程师叙述自动化测试学习思路

自动化测试介绍自动化测试(Automated Testing)，是指把以人为驱动的测试行为转化为机器执行的过程。实际上自动化测试往往通过一些测试工具或框架，编写自动化测试用例，来模拟手工测试过程。比如说，在项目迭代过程中，持…

阅读更多...

六、DataGrip的基础使用

六、DataGrip的基础使用

创建新数据库 1、点击MySQL图标，右键点击新建，然后选择框架(数据库) 2、输入数据库名称： 此处schema代表框架，和database(数据库)是同一性质的东西。创建新的表 1、右键点击数据库，点击新建，再点击表 2…

阅读更多...

ZooKeeper基础命令和Java客户端操作

ZooKeeper基础命令和Java客户端操作

1、zkCli的常用命令操作 （1）Help （2）ls 使用 ls 命令来查看当前znode中所包含的内容 （3）ls2查看当前节点数据并能看到更新次数等数据 （4）stat查看节点状态 （5&#xf…

阅读更多...

耐世特Nexteer EDI解决方案

耐世特Nexteer EDI解决方案

耐世特Nexteer曾经为美国通用汽车全资子公司，是一家集研发、制造、销售于一体的全球化集团公司。耐世特汽车系统公司是转向系统及相关先进技术的全球供应商。该公司为60多家汽车制造商设计、制造、销售电动助力转向器、液压助力转向器、转向管柱和传动轴产品&#x…

阅读更多...

【ACM出版】第四届人工智能与计算工程国际学术会议（ICAICE 2023）

【ACM出版】第四届人工智能与计算工程国际学术会议（ICAICE 2023）

ACM出版|第四届人工智能与计算工程国际学术会议 The 4th International Conference on Artificial Intelligence and Computer Engineering 为了在人工智能技术应用与计算工程领域进一步的探索，与国内外学界和业界相关人员交流新问题、新发现、新成果、新应用&…

阅读更多...

Spring Boot 中 Nacos 配置中心使用实战

Spring Boot 中 Nacos 配置中心使用实战

官方参考文档 https://nacos.io/zh-cn/docs/quick-start-spring-boot.html 本人实践 1、新建一个spring boot项目我的spirngboot版本为2.5.6 2、添加一下依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-…

阅读更多...

Linux：ansible自动化运维工具

Linux：ansible自动化运维工具

环境介绍当前所有执行权限我是在root下执行的，如果提示权限之类的，可以在每句命令前加上 sudo ansible主服务器 192.168.0.194 另外两个客户端分别为 192.168.0.193 192.168.0.192 软件只需要在主服务器上安装，客户端不需…

阅读更多...

2017. 网格游戏；2397. 被列覆盖的最多行数；2202. K 次操作后最大化顶端元素

2017. 网格游戏；2397. 被列覆盖的最多行数；2202. K 次操作后最大化顶端元素

2017. 网格游戏核心思想：前缀和枚举。读完题后可以发现，第一个机器人走的路线就像一条分割线，第二个机器人只能获得上面白色部分或者下面白色部分的最大值。这个最大值怎么求，我们可以通过前缀和来求，然后通过枚举转…

阅读更多...

idea 显示内存占用，分配内存实时内存

idea 显示内存占用，分配内存实时内存

1、打开项目 2、双击“shift” 3、输入show memory indicator 4、打开开关，搞定！ 5、效果

阅读更多...

F5服务器负载均衡能力如何？一文了解

F5服务器负载均衡能力如何？一文了解

但凡知道服务器负载均衡这个名词的，基本都知道 F5，因为负载均衡是 F5 的代表作，换句话来说，负载均衡就是由 F5 发明的。提到F5服务器负载均衡能力如何？不得不关注F5提出的关于安全、网络全面优化的解决方案&#xff0c…

阅读更多...

推荐文章

最新文章