使用Nokogiri库的Python程序

```python
import requests
from bs4 import BeautifulSoup
import os

# 设置
proxies = {"http": "", "https": ""}
# 设置headers
headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'
}
# 设置请求的URL
url = "https://www.yuanfudao.com/"

# 发送请求
response = requests.get(url, headers=headers,proxies=proxies)
# 使用BeautifulSoup解析返回的HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有img标签
images = soup.find_all('img')
# 遍历所有img标签
for image in images:
    # 获取图片的src属性
    src = image.get('src')
    # 如果图片的src属性以'/'开头,说明是域名外的图片,需要加上'http://www.yuanfudao.com/'前缀
    if src.startswith('/'):
        src = 'http://www.yuanfudao.com/' + src
    # 获取图片的文件名
    filename = src.split('/')[-1]
    # 创建保存图片的文件夹,如果不存在则创建
    if not os.path.exists('images'):
        os.makedirs('images')
    # 将图片保存到指定的文件夹中
    with open('images/' + filename, 'wb') as f:
        f.write(requests.get(src, headers=headers,proxies=proxies).content)
```

以上代码的工作原理是,首先发送一个GET请求到指定的URL,并使用BeautifulSoup解析返回的HTML。
然后,它找到所有img标签,并遍历这些标签。对于每个img标签,它获取图片的src属性,并检查这个属性是否以'/'开头。
如果以'/'开头,说明这是域名外的图片。
然后,它获取图片的文件名,并创建一个保存图片的文件夹(如果不存在的话)。
最后,它将图片保存到指定的文件夹中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/161959.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pycharm-community-2021版安装和配置

一、下载Pycharm-community-2021 1.从官网下载pycharm-community Pycharm 版本官网 二、安装PyCharm 1.打开下载完成的安装包,点击Next 2.安装PyCharm到其他位置,点击Next 3.一定把更新PATH变量勾上,可以创建桌面快捷方式,创建关联,最后…

【C语法学习】13 - fscanf()函数

文章目录 1 函数原型2 参数3 返回值4 比较5 示例5.1 示例15.2 示例2 1 函数原型 fscanf():从指定流stream读取格式化输入,函数原型如下: int fscanf(FILE *stream, const char *format, ...)2 参数 fscanf()函数参数包括三部分&#xff1a…

VR全景技术在文化展示与传播中有哪些应用?

引言: 随着科技的不断进步,虚拟现实(VR)全景技术已经成为文化展示与传播领域的一项重要工具。那么VR全景技术是如何改变文化展示与传播方式,VR全景技术又如何推动文化的传承和普及呢? 一.VR技术…

【MongoDB】MongoExport如何过滤数据导出

问题 使用MongoDB处理导出数据时,想增加数据过滤操作。 例如:导出所有isGirl为true的所有数据。 分析 在mongoexport说明文档中找到了query字段和queryFile字段,用来进行数据查询匹配导出。 query字段 后面直接跟 json格式数据。 queryF…

GPT技术的崛起:改变生活与挑战未来

GPT的广泛使用引发了许多关于其影响的讨论,包括可能对就业和互联网公司的存活造成挑战。在这篇博客中,我们将探讨这些问题,并分享我们自己在日常生活中如何使用GPT的经验。 1 GPT技术的广泛应用 GPT,或者通用预训练模型&#x…

NOIP2005提高组第二轮T3:传纸条

题目链接 NOIP2005提高组第二轮T3:传纸条 题目描述 小渊和小轩是好朋友也是同班同学,他们在一起总有谈不完的话题。一次素质拓展活动中,班上同学安排坐成一个 m m m 行 n n n 列的矩阵,而小渊和小轩被安排在矩阵对角线的两端…

什么是数据可视化,为什么数据可视化很重要?

数据可视化是数据的图形表示,可以帮助人们更轻松地理解和解释复杂的信息。它涉及创建数据的视觉表示,例如图表、图形、地图和其他视觉元素,以传达数据中的见解、模式和趋势。数据可视化是将原始数据转化为可操作知识的关键工具。 以下是数据…

实用篇-MQ消息队列

一、初识MQ 通讯分为同步通讯和异步通讯,同步通讯就比如我们日常生活中的打电话,看直播,能够得到及时的反馈。而异步通讯则类似于聊天软件聊天,不需要建立实时的连接,并且可以进行建立多个业务一起异步执行 1. 同步通…

Python之函数

函数介绍 函数:是组织好的,可重复使用的,用来实现特定功能的代码段。 就比如我们使用过的:input()、print()、str()、int()、len()等都是Python的内置函数 函数的定义 函数的调用 函数使用时的注意事项: ① 参数如…

AI:62-基于深度学习的人体CT影像肺癌的识别与分类

🚀 本文选自专栏:AI领域专栏 从基础到实践,深入了解算法、案例和最新趋势。无论你是初学者还是经验丰富的数据科学家,通过案例和项目实践,掌握核心概念和实用技能。每篇案例都包含代码实例,详细讲解供大家学习。 📌📌📌在这个漫长的过程,中途遇到了不少问题,但是…

Firefox 119 正式发布

Firefox 119 已正式发布。新版本除了修复 Bug 之外,还增强了 Firefox View 功能、支持在 PDF 文档中插入图片,以及引入 Encrypted Client Hello (ECH) 以增强隐私保护等。 主要变化 改进 Firefox View:用户可以在该页面查看所有窗口打开的标…

动态壁纸软件Live Wallpaper HD mac中文版功能特色

Live Wallpaper HD mac提供了一系列美丽的主题场景,将为您的桌面增添活力。从城市景观、日落到遥远的星系,每个屏幕都有特别的触感,可以定制您的天气小部件和时钟样式,并使用您喜爱的图片创建您自己的个性化壁纸。 Living Wallpap…