Python爬虫山东重庆各地区天气预报

天气数据获取工具

简单的Python脚本用于从中国天气网(http://www.weather.com.cn/textFC/chongqing.shtml)获取天气数据,并将数据保存到Excel文件中。

效果
运行效果

功能
输入中文省份名称,获取该省份下所有城市的天气数据。    
数据保存到指定文件夹中,文件名格式为:时间_省份_城市.xlsx。  

使用方法


安装必要的库

pip install -r requirements.txt

requirements.txt: 

lxml
pypinyin
pandas
tkinter
openpyxl

提示确什么库的话,pip install 即可

如:ModuleNotFoundError: No module named 'pypinyin'   只需要在终端执行‘ pip install pypinyin’

运行脚本

输入中文省份名称,脚本会自动获取天气数据并保存到天气数据文件夹。

运行程序

双击weather.exe运行程序,输入中文省份名称,会自动获取天气数据并保存为excel文件。

配置

默认输出文件夹:天气数据  
默认输出文件名:当天日期-当前时间-省份.xlsx

依赖
```
pandas
openpyxl
pypinyin
```
注意事项
请确保网络连接正常,否则无法从中国天气网获取数据。  
确保已经安装所需的依赖。

完整代码

import os
import pandas as pd
from datetime import datetime
from pypinyin import pinyin, Style# 获取指定省份的天气数据,并保存到指定文件夹中
def get_weather_data(province_name, output_folder='天气数据', output_filename='output.xlsx'):# 将中文省份名称转换为拼音pinyin_name = ''.join([''.join(item) for item in pinyin(province_name, style=Style.NORMAL)])# 构造天气数据的URLurl = f"http://www.weather.com.cn/textFC/{pinyin_name}.shtml"try:# 使用pandas的read_html函数读取网页中的表格数据tables = pd.read_html(url)except Exception as e:print(f"Error: {e}")return Noneif not tables:print(f"No valid tables to process for {province_name}.")return None# 合并所有表格的数据all_data = pd.concat([table.iloc[:, :-1] for table in tables])# 确保输出文件夹存在os.makedirs(output_folder, exist_ok=True)# 生成带有路径的输出文件名output_filename = generate_output_filename(output_folder, pinyin_name, output_filename)# 将数据保存到Excel文件中all_data.to_excel(output_filename, index=False)return output_filename# 生成带有时间戳和省份拼音的输出文件名
def generate_output_filename(output_folder, pinyin_name, base_filename):timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")return os.path.join(output_folder, f"{timestamp}_{pinyin_name}_{base_filename}")if __name__ == "__main__":# 从终端输入省份名称province_name = input("请输入省份名称(中文): ")output_folder = '天气数据'# 获取天气数据并保存到文件中output_filename = get_weather_data(province_name, output_folder=output_folder)if output_filename:print(f"Data saved to {output_filename}")

Github仓库地址

https://github.com/Wcowin/Weather

源码开源

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/297424.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

netstat的使用

netstat命令查看系统中网络连接状态&#xff0c;可以从显示的Linux网络系统状态信息得知整个Linux系统的网络情况&#xff0c;包括网络连接、路由表、接口状态、伪装连接、网络链路和组播成员组等信息。 语法&#xff1a;netstat [-acCeFghilMnNoprstuvVwx][-A<网络类型>…

go写的海盗王数据库重置工具

很久没有用go去写代码了&#xff0c;很多语法都快忘记了。 为了测试一下界面库govcl的用法&#xff0c;拉了一个界面窗口之后&#xff0c;想想还是把代码也补上去吧。 于是&#xff0c;就写了这个海盗王数据库重置工具。 这个工具适合开服的人使用&#xff0c;可以将海盗王的账…

服装店管理系统打造门店拓客、促活、存留营销方案

打造门店拓客、促活和存留营销方案对于服装店的管理系统来说是非常重要的。以下是一些可行的方案&#xff1a; 1. 会员管理系统&#xff1a;引入会员管理功能&#xff0c;建立会员档案&#xff0c;跟踪会员消费记录和偏好。通过会员系统&#xff0c;可以实施积分制度、生日礼品…

浅谈springboot整合ganymed-ssh2远程访问linux

环境介绍 技术栈 springbootmybatis-plusmysqlganymed-ssh2 软件 版本 mysql 8 IDEA IntelliJ IDEA 2022.2.1 JDK 1.8 Spring Boot 2.7.13 mybatis-plus 3.5.3.2 SSH(远程连接工具)连接原理&#xff1a;ssh服务是一个守护进程(demon)&#xff0c;系统后台监听客户…

IDEA控制台乱码

报错情况&#xff1a; 报错原因&#xff1a;Idea的vm用的编码格式不一致&#xff1a;需要修改为UTF-8 你看Tomcat我之前下在后修改果&#xff0c;就没有报错&#xff0c;新人刚下载也有乱码问题 问题解决&#xff1a; 按我步骤来一定对 下面这俩文件打开输入&#xff1a; -D…

VSCode中配置prettier和ESLint

文章目录 了解ESLint和Prettier的作用prettier配置ESLint配置常见问答ESLint 和Prettier 有什么区别&#xff1f;为什么我应该同时使用ESLint 和Prettier&#xff1f;在使用ESLint 和Prettier 时&#xff0c;有可能出现它们之间的规则冲突吗&#xff1f;我已经在项目中使用了ES…

jvm对象探究

hostpot虚拟机对象探究 jvm虚拟机创建对象的流程 ava虚拟机&#xff08;JVM&#xff09;创建对象的过程包括以下步骤&#xff1a; 类加载&#xff1a; 首先&#xff0c;JVM会检查对象的类是否已经被加载。如果该类还没有被加载&#xff0c;JVM会通过类加载器加载该类的字节码…

每日一题——LeetCode888

方法一 个人方法&#xff1a; 交换后要达到相同的数量&#xff0c;那么意味着这个相同的数量就是两个人总数的平均值&#xff0c;假设A总共有4个&#xff0c;B总共有8个&#xff0c;那么最后两个人都要达到6个&#xff0c;如果A的第一盒糖果只有1个&#xff0c;那么B就要给出6…

四、Spring IoC实践和应用(基于配置类方式管理 Bean)

本章概要 基于配置类方式管理 Bean 完全注解开发理解实验一&#xff1a;配置类和扫描注解实验二&#xff1a;Bean定义组件实验三&#xff1a;高级特性&#xff1a;Bean注解细节实验四&#xff1a;高级特性&#xff1a;Import扩展实验五&#xff1a;基于注解配置类方式整合三层…

域内定位个人PC的三种方式(1)

会话搜集 在cmd下调用query session命令可以获得当前环境下的windows会话 NetSessionEnum 这个函数不允许直接查询是谁登陆&#xff0c;但是它允许查询是谁在访问此工作站的网络资源时所创建的网络会话&#xff0c;从而知道来自何处&#xff0c;此函数不需要高权限即可查询 第…

漏洞复现-红帆OA iorepsavexml.aspx文件上传漏洞(附漏洞检测脚本)

免责声明 文章中涉及的漏洞均已修复&#xff0c;敏感信息均已做打码处理&#xff0c;文章仅做经验分享用途&#xff0c;切勿当真&#xff0c;未授权的攻击属于非法行为&#xff01;文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直接或者间接的…

EA常见画图(类图、包图、构件图、状态图、顺序图、活动图)

EA常见活动图&#xff0c;状态图画法 类图:111&#xff08;1&#xff09;给关系添加注释&#xff08;2&#xff09;设置关系线样式 包图&#xff1a;&#xff08;1&#xff09;创建包图&#xff08;2&#xff09;在包中添加子包&#xff1a;&#xff08;3&#xff09;在包中添加…