使用Python轻松实现科研绘图

当撰写在学术期刊上发表的文章时,图表的布局和风格应符合预定义的格式要求。这样可以确保该出版物的所有文章都具有一致的风格,并且任何包含的图表在打印时都是高质量的。

Python在科学界广泛使用,并提供了创建科学绘图的好方法。然而,当使用Python中最流行的绘图库之一matplotlib时,默认的图表质量较差,需要进行调整以确保满足要求。更改matplotlib图形的样式可能非常耗时,这就是scienceplots库派上用场的地方。只需几行代码,就可以立即改变图形的外观,而无需花费太多时间来研究如何更改图形的不同部分。

scienceplots该库允许用户创建简单、信息丰富的图表,类似于学术期刊和研究论文中的图表。不仅如此,它还将所需的DPI设置为600(对于某些样式),这通常是出版物的要求,以确保打印出高质量的印刷图形。scienceplots库包含多种样式,包括对多种语言的支持,包括中文和日文等。可以通过下面的链接探索scienceplots库中的全部样式。

本文将探讨如何将一些基本和常见的数据可视化转换为可以包含在科学出版物中的形式。

1.设置scienceplots

在使用scienceplots库创建绘图之前,需要确保计算机上安装了LaTeX。LaTeX是一种排版系统,专为创建技术和科学文档而设计。如果正在使用Google Colab,则可以在单元格中运行以下代码来安装LaTeX。

!sudo apt-get install dvipng texlive-latex-extra texlive-fonts-recommended texlive-latex-recommended cm-super

在设置好LaTeX之后,可以使用pip安装scienceplots库:

pip install SciencePlots

在选择的平台上安装了库和LaTeX之后,就可以导入scienceplots库以及matplotlib

import scienceplots
import matplotlib.pyplot as plt

2.创建用于绘图的虚拟数据

在生成一些图表之前,首先需要创建一些样本数据。我们将在本文的后面部分展示scienceplots库如何处理现实世界的数据。

对于本文的这一部分,现在将使用np.linspace创建一些线性间隔的值,然后对该数据进行一些随机的数学计算。

# 生成x值
x = np.linspace(0, 10, 20)# 生成带有随机噪声的y值
y = np.sin(x)
y2 = np.cos(x)
y3 = y2 * 1.5

一旦创建了数据(或者如果从csv文件中加载数据,则将其加载到pandas中),就可以开始创建绘图了。

3.使用Matplotlib创建带有标记的折线图

我们将首先处理的是折线图。可以通过使用matplotlib.plot()函数并传入xy参数的必需数据来轻松创建此图表。由于我们处理的是从方程中派生的变量,因此有时将这些变量包含在图例中对于读者理解它们可能很方便。

Matplotlib的一个好处是我们可以使用LaTeX方程作为标签。我们只需要用美元符号($)将方程括起来即可。如下是使用scienceplotsmatplotlib创建带有标签的折线图的示例代码:

plt.figure(figsize = (6,6))
plt.plot(x, y, marker='o', label='$y=sin(x)$')
plt.plot(x, y2, marker='o', label='$y=cos(x)$')
plt.plot(x, y3, marker='o', label='$y=y2*1.5$')plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.show()

当运行上述代码时,会得到以下带有标准颜色的基本Matplotlib图像:

图片

应用scienceplots之前的基本Matplotlib折线图

尽管上图看起来可用,但它的质量(dpi和大小)以及样式可能并不完全适合在期刊中发表。

4.应用SciencePlots样式到线型图

要立即转换图像,可以添加一行代码:使用with语句,调用Matplotlib的style.context函数,并允许传入SciencePlots提供的众多可用样式之一。

with plt.style.context(['science', 'high-vis']):plt.figure(figsize = (6,6))plt.plot(x, y, marker='o', label='$y=sin(x)$')plt.plot(x, y2, marker='o', label='$y=cos(x)$')plt.plot(x, y3, marker='o', label='$y=y2*1.5$')plt.xlabel('X Variable (mm)')plt.ylabel('Y Variable')plt.legend()plt.show()

当运行上述代码时,将得到以下更适合于期刊发表的绘图。

应用scienceplots样式后的Matplotlib折线图

该图形简洁(即没有多余的图表元素),并且很容易区分不同的线条。此外,在Jupyter Notebook中查看此图形时,它可能会显示得非常大,即使我们设置了相对较小的图形尺寸。这是因为图形的DPI被设置为600,这通常是许多出版物的要求,并确保图形尽可能清晰。

然后尝试应用另一种样式。这次将使用电气和电子工程师学会(IEEE)的样式。要做到这一点,只需要将high-vis替换为ieee即可改变样式。

with plt.style.context(['science', 'ieee']):plt.figure(figsize = (6,6))plt.plot(x, y, marker='o', label='$y=sin(x)$')plt.plot(x, y2, marker='o', label='$y=cos(x)$')plt.plot(x, y3, marker='o', label='$y=y2*1.5$')plt.xlabel('X')plt.ylabel('Y')plt.legend()plt.show()

当运行上述代码时,将得到以下使用IEEE推荐样式的绘图:

图片

应用scienceplots IEEE风格后的Matplotlib折线图

5.使用SciencePlots绘制直方图

在前面的示例中探讨了如何将样式应用于线型图,也可以将相同的样式应用于其他类型的绘图,接下来尝试如何将这种样式应用于直方图。

首先,使用以下代码创建一个Matplotlib图形,使用一些射线(地质形态的自然放射性测量)数据。为了显示第二个数据集,本文将同样的数据向右调整了20个API单位。

plt.figure(figsize = (6,6))
plt.hist(df['GR'], bins=100, label='GR1', alpha =0.5)
plt.hist(df['GR']+20, bins=100, label='GR2', alpha=0.5)
plt.xlim(0, 150)
plt.xlabel('Gamma Ray')
plt.ylabel('Frequency')
plt.legend()
plt.show()

当运行上面的代码时,将得到以下图形:

图片

射线测量的简单Matplotlib直方图

可以注意到它使用了Matplotlib的标准样式,并且看起来非常基础,两个数据集互相重叠,这导致一些信息被隐藏。现在查看一下IEEE样式如何改变这种情况:

with plt.style.context(['science', 'ieee']):plt.figure(figsize = (6,6))plt.hist(df['GR'], bins=100, label='GR1')plt.hist(df['GR']+20, bins=100, label='GR2')plt.xlim(0, 150)plt.xlabel('Gamma Ray')plt.ylabel('Frequency')plt.legend()plt.show()

当运行上述代码时,将得到以下使用IEEE样式的图形。然而,第二个射线数据集仍然遮挡了第一个数据集。

应用scienceplots IEEE样式后的射线测量的Matplotlib直方图

我们对SciencePlots库能够处理任何重叠并自动应用透明度抱有过高的期望,为此需要付出一点努力,需要为每个数据集添加alpha参数即可。

with plt.style.context(['science', 'ieee']):plt.figure(figsize = (6,6))plt.hist(df['GR'], bins=100, label='GR1', alpha=0.5)plt.hist(df['GR']+20, bins=100, label='GR2', alpha=0.5)plt.xlim(0, 150)plt.xlabel('Gamma Ray')plt.ylabel('Frequency')plt.legend()plt.show()

当运行带有alpha更改的上述代码时,将得到以下图形:

图片

应用scienceplots并为数据集添加透明度后的射线测量值的直方图

在这个图形中,可以看到两个数据集的条形的变化,建议检查所需发表的期刊的样式指南,以确保使用透明度是可接受的。

6.应用Science Plots到Seaborn图形

不仅可以将scienceplots库中的样式应用于matplotlib图形,还可以将其应用于Seaborn图形。这是因为Seaborn基于matplotlib代码开发

在创建图形时,有时Seaborn提供了比matplotlib更简单的绘图方式。例如,当有一个基于文本的分类变量时,我们希望能够绘制该变量,而不必为每个类别添加单独的散点图。

在这个例子中,有一些中子孔隙度和堆积密度数据,这是常见的测井测量。对于每个测量,还有一个岩性类别,这个数据集来源于Force 2020 Xeek机器学习竞赛数据集。

首先,需要在笔记本中导入seaborn:

import seaborn as sns

导入seaborn库后,可以使用以下代码创建散点图。

plt.figure(figsize=(6, 6))
sns.scatterplot(data=df, x='NPHI', y='RHOB', hue='LITH', s=10)plt.ylabel('Bulk Density (RHOB) - g/cc')
plt.xlabel('Neutron Porosity (NPHI) - dec')
plt.ylim(2.8, 1.4)
plt.show()

当运行上面的代码时,会得到以下数据按不同岩性着色的散点图:

图片

使用Seaborn生成的基本中子-密度交叉图

还需要确保样式适合预期的期刊,并且颜色对所有读者都可访问和使用。要应用scienceplots样式,可以使用与之前相同的语法:

with plt.style.context(['science', 'ieee']):plt.figure(figsize=(10, 8))sns.scatterplot(data=df, x='NPHI', y='RHOB', hue='LITH', s=10)plt.ylim(2.8, 1.4)plt.title('RHOB vs NPHI Crossplot')plt.show()

当运行上面的代码时,会得到以下具有改进样式的图,包括新的调色板。

图片

Seaborn散点图,使用scienceplots样式显示堆积密度与中子孔隙度,按岩性变化着色

选择图形的调色板可能会很棘手且耗时,然而它可以使图形对具有视觉问题的读者更易访问和理解。此外,一些颜色在黑白打印时可能不容易区分,可以考虑为不同类别分配不同的形状,这对于从实验室过程中获得的小型数据集中尤为重要。

综上,本文探讨了如何快速将基本的matplotlib图形转化为可以轻松添加到科学出版文章中的形式。这些图形可能仍然需要进一步调整,但通过使用scienceplots库,可以实现大部分需求。另外,建议查看所选择期刊的作者工具包,以确保创建的图形符合要求的标准。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/174190.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RT-Thread STM32F407 五步完成OLED移植

这里使用RT-Thread Studio提供的IIC API驱动函数进行移植 第一步,进入RT-Thread Settings配置IIC驱动 第二步,进入board.h,定义IIC宏 第三步,进入STM32CubeMX,配置时钟及IIC 第四步,添加oled.c及oled…

【图像处理:OpenCV-Python基础操作】

【图像处理:OpenCV-Python基础操作】 1 读取图像2 显示图像3 保存图像4 图像二值化、灰度图、彩色图,像素替换5 通道处理(通道拆分、合并)6 调整尺寸大小7 提取感兴趣区域、掩膜8 乘法、逻辑运算9 HSV色彩空间,获取特定…

Django实战项目-学习任务系统-任务完成率统计

接着上期代码内容,继续完善优化系统功能。 本次增加任务完成率统计功能,为更好的了解哪些任务完成率高,哪些任务完成率低。 该功能完成后,学习任务系统1.0版本就基本完成了。 1,编辑urls配置文件: ./mysi…

千万富翁分享:消费多少免单多少,电商运营高手实战秘籍拆解

千万富翁分享:消费多少免单多少,电商运营高手实战秘籍拆解 后疫情时代,国内电商圈层进程依然是在高速发展阶段,今年2023年双十一也彻底落下帷幕,但这次相较于往常却没有公布具体的成交规模数据,那么&#x…

VS项目属性变量

VS项目属性变量 $(SolutionDir) 获取解决方案的路径 $(Platform) 平台名字 → x86 / x64 $(ProjectName) 工程名字 $(Configuration) 当前的项目模式 → Debug / Release

如何在 Windows 10/11 上高质量地将 WAV 转换为 MP3

WAV 几乎完全准确地存储了录音硬件所听到的内容,这使得它变得很大并占用了更多的存储空间。因此,WAV 格式在作为电子邮件附件发送、保存在便携式音频播放器上、通过蓝牙或互联网从一台设备传输到另一台设备等时可能无法正常工作。 如果您遇到 WAV 问题&…

做一个Springboot文章分类模块

目录 文章分类 1、新增文章分类 前言 代码编写 测试 2、 文章分类列表 前言 代码编写 测试 3、获取文章列表详情 前言 代码实现 测试 4、更新文章分类 前言 代码实现 测试 5、删除文章分类 前言 代码实现 测试 分页查询 文章列表条件分页 前言 代码编…

Netty Review - 核心组件扫盲

文章目录 PreNetty Reactor 的工作架构图CodePOMServerClient Netty 重要组件taskQueue任务队列scheduleTaskQueue延时任务队列Future异步机制Bootstrap与ServerBootStrapgroup()channel()option()与childOption()ChannelPipelinebind()优雅地关闭EventLoopGroupChannleChannel…

ts学习02-数据类型

新建index.html <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </h…

【数据结构】经典单链表OJ题!!

学习完单链表&#xff0c;习题就成了最好的巩固方式 目录 1.链表分割:思路&#xff1a;代码实现&#xff1a; 2.随机链表的复制:思路1&#xff1a;代码实现&#xff1a;思路2&#xff1a;代码实现&#xff1a; 3.环形链表:3.1环形链表1:思路&#xff1a;代码实现&#xff1a; 3…

Redis的特性以及使用场景

分布式发展历程参考 陈佬 http://t.csdnimg.cn/yYtWK 介绍redis Redis&#xff08;Remote Dictionary Server&#xff09;是一个基于客户端-服务器架构的在内存中存储数据的中间件&#xff0c;属于NoSQL的一种。它可以用作数据库、缓存/会话存储以及消息队列。 作为一种内存数…

Apache Airflow (三) :Airflow WebUI操作介绍

&#x1f3e1; 个人主页&#xff1a;IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客 &#x1f6a9; 私聊博主&#xff1a;加入大数据技术讨论群聊&#xff0c;获取更多大数据资料。 &#x1f514; 博主个人B栈地址&#xff1a;豹哥教你大数据的个人空间-豹…