5个用于地理空间数据分析的Python包

大家好,地理空间数据分析在城市规划、环境研究、农业和交通等行业中至关重要。不断增长的需求导致Python包在各种地理数据分析要求上的使用增加,例如分析气候模式、研究城市发展或跟踪疾病传播等,评估和选择具有快速处理、修改和可视化能力的正确工具对于有效分析和可视化地理空间数据至关重要。

首先,了解什么是地理空间数据至关重要。地理空间数据是具有地理成分的数据,表示地球表面上对象、特征或事件的位置和特性。它描述了物理宇宙中各种物体的空间连接、分布和属性。地理空间数据主要有两种类型:

  • 栅格数据(Raster data):适用于没有固定边界的连续信息,表示为具有值的单元格网格,这些值表示观察到的特征。通常在固定的时间间隔上进行监测,并进行插值以创建连续表面。

  • 矢量数据(Vector data):使用点、线和多边形来表示空间属性,包括兴趣点、交通网络、行政边界和土地地块等,通常用于具有精确位置或硬约束的离散数据。

地理空间数据可以以多种格式存储,如 ESRI Shapefile、GeoJSON、Erdas Imagine Image File Format(EIF)、GeoTIFF、Geopackage(GPKG)、GeoJSON、Light Detection、Ranging(LiDAR)等。

地理空间数据涵盖了各种类型,例如卫星图像、高程模型、点云、土地利用分类和基于文本的信息,为跨行业的空间分析和决策提供了有价值的洞察,微软、谷歌、Esri和亚马逊网络服务等大型公司都利用地理空间数据来获得有价值的洞察。接下来一起了解一下地理空间数据分析的五大Python包,这些包能够进行数据读取/写入、操作、可视化、地理编码和地理索引,适用于初学者和有经验的用户,为地理空间数据的有效探索、可视化和洞察提供支持。

1. Geopandas

适用于:矢量数据

Geopandas是一个广泛使用的Python库,用于处理矢量地理空间数据,在Pandas DataFrames中提供直观的地理数据处理,它支持Shapefile和GeoJSON等格式,并提供合并、分组和空间连接等空间操作。Geopandas可以与流行的库(如Pandas、NumPy和Matplotlib等)无缝集成,它可以处理大型数据集,但这可能带来挑战。Geopandas包通常用于空间数据分析任务,包括空间连接、查询以及缓冲区和交叉分析等地理空间操作,需要使用不同的包,如Shapely处理几何操作,Fiona访问文件,以及matplotlib绘图。

例如,可以使用Geopandas来探索房地产数据,以确定城市中最昂贵的街区,或者分析人口数据以可视化不同社区的增长和迁移模式。

可以使用以下pip命令安装该包:

pip install geopandas

使用GeoPandas进行绘图,通过以下代码查看内置地图:

import geopandas 
# 检查可用地图
geopandas.datasets.available

本文将使用GeoPandas加载世界地图数据集,提取美国的形状文件,并使用以下代码将其绘制在图表上:

# 选择特定地图
geopandas.datasets.get_path('naturalearth_lowres')
# 打开所选地图-GeoDataFrame
world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
# 创建GeoDataFrame的子集
usa = world[world.name == "United States of America"]
# 绘制子集
usa.plot();

以上代码将打印出一个子集数据框的地图:

图片

2. Folium

适用于:点云

Folium是一个用于创建带有标记、弹出式窗口、choropleth和其他地理空间可视化的Python库,它与Leaflet JavaScript库集成,并允许将地图导出为HTML。并且可以与Geopandas和Cartopy结合使用,并使用Map Tiles处理大型数据集。Folium在简洁性、美观性以及与其他地理空间库的集成方面表现出色,然而对于高级地理空间分析和操作,Folium可能存在一些局限性。

例如,Folium可用于供应链和物流领域,用于可视化分销网络、优化路线和监测货物位置及装运地点。可以使用以下命令安装Folium:

pip install folium

现在可以使用以下几行代码在以[0, 0]为中心的示例交互式地图上放置一个标记:

import folium
# 以中心坐标(0, 0)生成Folium地图
map = folium.Map(location=[0, 0], zoom_start=2)
# 定位坐标(0, 0)
folium.Marker([0, 0]).add_to(map)
# 显示地图
map

图片

可以根据特定的地理空间数据进一步自定义此地图,例如添加标记、图层或样式选项。

3. ipyleaflet

适用于:点云,交互式

ipyleaflet包能够在Python中轻松创建交互式地图,特别适用于Jupyter笔记本,在其中允许用户生成和共享具有各种底图、标记和其他地理空间操作的交互式地图。ipyleaflet基于Leaflet JavaScript库构建,支持GeoJSON和WMS图层、CSS和JavaScript样式以及地理空间计算。虽然ipyleaflet在交互式小部件方面表现出色,但由于其依赖于JavaScript,对于纯Python项目可能不是理想选择。

例如,ipyleaflet可以应用于环境监测,以可视化传感器数据、监测空气质量并实时评估环境变化。要安装ipyleaflet,可以使用以下pip命令:

pip install ipyleaflet

使用ipyleaflet绘图,用以下代码在地图上创建一个标记,该标记位于纽约市的坐标(40.7128,-74.0060)处,以表示感兴趣的点:

from ipyleaflet import Map, Marker
# 创建地图
m = Map(center=(40.7128, -74.0060), zoom=12)
# 添加标记
marker = Marker(location=(40.7128, -74.0060))
m.add_layer(marker)

以下是代码的输出结果:

图片

4. Rasterio

适用于:栅格数据

Rasterio是一个功能强大的Python库,用于处理地理空间栅格数据,具有高效的性能和广泛的操作,如裁剪、重投影和重采样。它支持各种栅格格式,并与其他地理空间库良好集成,尽管在处理矢量数据和复杂分析任务方面存在一些限制。然而,Rasterio是Python中高效操作和处理栅格数据的必备工具。

例如,Rasterio可用于读取和写入卫星图像、进行地形分析、从数字高程模型中提取数据以及进行遥感分析等任务。

!pip install rasterio

rasterio.open()函数用于打开文件,read()方法将图像读取为NumPy数组。最后,使用Matplotlib中的plt.imshow()函数显示图像,plt.show()在输出中显示绘图。

import rasterio
from rasterio.plot import show

使用rasterio库打开并可视化来自kaggle数据集“High-resolution GeoTIFF images of climatic data”中的sample.tif文件的栅格图像,将红色通道(图像中的一种颜色通道)作为子图使用Reds颜色映射进行显示,将原始图像(包含多个颜色通道)作为另一个子图使用viridis颜色映射进行显示。也可以使用相同的方法可视化其他颜色通道,如绿色和蓝色。

src = rasterio.open('/content/sample.tif')
plt.figure(figsize=(15,10))
fig, (axr, axg) = plt.subplots(1,2, figsize=(15,7))
show((src, 1), ax=axr, cmap='Reds', title='red channel')
show((src), ax=axg, cmap='viridis', title='original image')
plt.show()

图片

原始GeoTIFF图像(右)来源:Kaggle.com

https://www.kaggle.com/datasets/abireltaief/highresolution-geotiff-images-of-climatic-data

在地理空间分析中,分析特定的颜色通道(如红色、蓝色和绿色)是为了关注或提取与图像中那些颜色分量相关的特定属性、特征或特征所表示的有价值信息,可以用于遥感中的植被健康、植被指数或水体等方面。

5. Geoplot

适用于:矢量数据,交互式

Geoplot是一个用户友好型的Python库,可以快速创建具有吸引力的地理空间可视化效果,包括等值线地图和散点图,它与流行的数据处理库(如Pandas等)无缝集成,并支持多种地图投影。然而,Geoplot在交互式地图支持和绘图类型方面存在一些限制,比专门的地理空间库要少。尽管如此,它仍然对于快速实现地理空间数据可视化和获取空间模式的洞察力非常有价值。

!pip install geoplot

本文将使用Geoplot绘制一个等值图可视化,根据世界形状文件中的“continent”属性选择亚洲国家,根据“pop_est”属性分配颜色强度,并使用带图例的“icefire”彩色地图进行绘制,图例的尺寸大小为10x5。

import geoplot
# 绘制亚洲人口分布图
asia = world.query("continent == 'Asia'")
geoplot.choropleth(asia, hue = "pop_est", cmap = "icefire",legend=True, figsize = (10, 5));

图片

例如,geoplot包可以创建choropleth地图,用于可视化人口密度、绘制犯罪事件的空间模式、显示环境因素的分布,并根据地理数据分析疾病的传播。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/174972.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谈谈一个IT杂家的职业生涯规划,你的护城河被AI 攻破了么

文章大纲 没有顶会的从业者:成为深度学习老中医AIGC 还未能克服的难点:忽然的惊喜 -- 大模型的智能涌现未来还能做点什么,从计算机视觉的发展走向看T 字型人才与护城河成为更加熟练使用人工智能的人 参考文献与学习路径 我的职业生涯将近十年…

Chrome版本对应Selenium版本

1.获得浏览器版本号和驱动 浏览器版本: 119.0.6045.124 浏览器驱动版本: 119.0.6043.1 / 120.0.6051.0 访问 https://vikyd.github.io/download-chromium-history-version/ 2. 安装selenium pip install selenium4.1.1 -i http://pypi.mirrors.ustc.edu.cn/simple/ --trusted…

k8s自定义Endpoint实现内部pod访问外部应用

自定义endpoint实现内部pod访问外部应用 endpoint除了可以暴露pod的IP和端口还可以代理到外部的ip和端口 使用场景 公司业务还还没有完成上云, 一部分云原生的,一部分是实体的 业务上云期间逐步实现上云,保证各个模块之间的解耦性 比如使…

第3章:搜索与图论【AcWing】

文章目录 图的概念图的概念图的分类有向图和无向图 连通性连通块重边和自环稠密图和稀疏图参考资料 图的存储方式邻接表代码 邻接矩阵 DFS全排列问题题目描述思路回溯标记剪枝代码时间复杂度 [N 皇后问题](https://www.luogu.com.cn/problem/P1219)题目描述全排列思路 O ( n ! …

20231114在HP笔记本的ubuntu20.04系统下向RealmeQ手机发送PDF文件

20231114在HP笔记本的ubuntu20.04系统下向RealmeQ手机发送PDF文件 2023/11/14 14:11 手机:Realme Q 笔记本电脑:HP https://item.jd.com/100012583174.html 惠普(HP)战66 三代AMD版 14英寸轻薄笔记本电脑(锐龙7nm 六核…

PlantUML基础使用教程

环境搭建 IDEA插件下载 打开IEDA系列IDE,从FIle–>Settings–>Plugins–>Marketplace 进入到插件下载界面,搜索PlantUML,安装PlantUML Integration和PlantUML Parser两个插件,并重启IDE 安装和配置Graphviz 进入官网…

假如我是Langchain专家,你会问什么来测试我的水平

推荐Langchain YouTube 视频排行榜 1. 假如我是Langchain专家,你会问什么来测试我的水平; 作为Langchain专家,您可能需要回答一系列深入和具体的问题,这些问题旨在测试您对Langchain的理解和实际应用能力。以下是一些可能的问题…

Latex在图表标题里面引用参考文献时,出现参考文献顺序混乱的解决方案(适用于bibtex)

问题描述 如果你在figure环境的\caption或\captionof中使用\cite,但是参考文献的顺序仍然不正确,可能是因为LaTeX的处理流程导致了这个问题。 比如图片在第二章节但里面引用了参考文献,在文章末尾的参考文献第二章图片的参考文献顺序&#…

Linux 关闭对应端口号进程

查看当前的端口号是否在运行 找出端口号端口号进程 netstat -anp | grep 9000 关闭端口号 kill -9 [PID]

【计算思维】少儿编程蓝桥杯青少组计算思维题考试真题及解析C

【科技素养】少儿编程蓝桥杯青少组计算思维题考试真题及解析 1.天平的左右两端分别放有一些砝码,如下图所示,右边的砝码不变,从左边最多拿走几个砝码,可以使天平左右两边平衡: A、1 B、2 C、3 D、4 2.把下面的图形…

ORACLE数据库实验总集 实验一 Oracle数据库安装与配置

一、实验目的 (1)掌握 Oracle数据库服务器的安装与配置 (2)了解如何检查安装后的数据库服务器产品,验证安装是否成功。 (3)掌握 Oracle数据库服务器安装过程中出现的问题的解决方法。 二、实验…

【HUST】网安纳米|2023年研究生纳米技术考试参考

目录 1 纳米材料是什么 2 纳米材料的结构特性 3 纳米结构的其他特性 4 纳米结构的检测技术 5 纳米材料的应用 打印建议:PPT彩印(这样重点比较突出),每面12张PPT,简单做一下关键词目录,亲测可以看清。如…