python每日可视化分析:从过去到现代数据分析的演进

分析目标

本文旨在探索数据分析发展历程中的关键时刻,包括重要人物的贡献和大事件的发生。通过对比不同年代的数据分析技术和方法,我们可以更好地理解数据分析如何成为今天决策制定不可或缺的一部分。

分析步骤
  1. 收集数据:搜集关于数据分析历史上重要人物和事件的信息。

  2. 数据与可视化:创建一组数据,展示不同年份全球数据量的增长,并通过可视化技术加入人物和大事件的标记。

  3. 分析改进前后的差异:对比分析人物贡献和大事件发生前后数据分析技术的变化。

数据与可视化

我们创建了一组数据,显示从1662年至2010年全球数据量的增长。重要的里程碑包括John Graunt的统计分析开始,Alan Turing的图灵机概念,Tim Berners-Lee的万维网发明,以及Hadley Wickham在数据分析工具方面的现代化努力。

通过Matplotlib库,我们将这些数据和事件以及相关人物的贡献呈现在一个时间线图上。这不仅展示了数据量的增长,也突出了数据分析历史上的重要时刻和人物。

改进前

这是每个人物对应的时间和主要的贡献,我们通过文字的方式进行描述,对于每个时间点、数据量、整体的变化感知不是很清晰,没有太多的体感,数据量较小也不知道具体是多少,对数据分析来说不是很友好的呈现方式

  1. John Graunt (1662): 被认为是统计学的创始人之一。此时期数据量非常小,主要依靠手工记录。

    • 数据量: 微乎其微

    • 大事件: 开始使用统计方法分析人口数据。

  2. Carl Friedrich Gauss (1801): 对统计理论做出了重要贡献,包括最小二乘法。

    • 数据量: 较小

    • 大事件: 统计学和概率理论的发展。

  3. Ronald A. Fisher (1912): 现代统计学的重要人物,提出方差分析等概念。

    • 数据量: 逐渐增长

    • 大事件: 统计学在科学研究中的应用扩展。

  4. Alan Turing (1936): 计算机科学的先驱,提出图灵机模型。

    • 数据量: 逐渐增长

    • 大事件: 计算机科学的诞生,数据处理能力得到提升。

  5. Tim Berners-Lee (1989): 万维网的发明者,极大地促进了数据的生成和共享。

    • 数据量: 显著增长

    • 大事件: 互联网时代的开始,数据量开始爆炸性增长。

  6. Jim Gray (2003): 数据库技术的先驱,对大数据处理做出了贡献。

    • 数据量: 巨大

    • 大事件: 数据库和大数据技术的发展。

  7. Geoffrey Hinton (2006): 深度学习和神经网络的领军人物。

    • 数据量: 极大

    • 大事件: 深度学习技术的突破,开启了AI时代。

  8. Hadley Wickham (2010): R语言的重要贡献者,简化了数据分析过程。

    • 数据量: 巨量

    • 大事件: 数据科学和统计计算的现代工具和方法的发展。

第一次改进

我们通过一个表格来展示数据分析领域的关键人物,数据量级和大事件,对同类项进行划分,能比较清晰的看出不同字段对应的事件和人物,数据量的情况等。但是对于数据分析来说我们需要对可视化有更高的要求

第二次改进

我们通过一个折线图把关键信息都描述在一个图里,不仅呈现了数据量的增长,还描绘了数据分析领域发展的脉络,包括人物直观的图像。这为我们提供了一个全面的视角,展现了数据分析是如何逐步成为现代社会的重要组成部分,包括哪些重点事件和人物的推动下演进。这里均通过python代码实现。

分析结论

从John Graunt的早期统计学应用,到Hadley Wickham对现代数据科学工具的贡献,数据分析领域经历了巨大的变革。随着全球数据量的爆炸式增长,数据分析的重要性也随之增加。历史上的人物和大事件不仅塑造了数据分析的方法和技术,也影响了我们如何理解和利用数据。未来,随着技术的不断进步,数据分析将继续发挥其在解决复杂问题和推动社会进步中的关键作用。

这篇文章通过对过去和现在的对比,展现了数据分析的发展历程和关键人物的重要性,为理解其对未来的潜在影响提供了不同的视角。

python代码(包括对人物图像的插入)

需要插入的人物头像欢迎关注 公众号 数据分析螺丝钉 回复关键词 python可视化 领取

import matplotlib.pyplot as pltfrom matplotlib.offsetbox import OffsetImage, AnnotationBboximport numpy as np# Define the data for the timelineyears = [1662, 1801, 1912, 1936, 1989, 2003,  2010]data_volumes = [0.0001, 0.0001, 0.0001, 0.0002, 0.01, 1, 2]  # in Zettabytespersons = ["John Graunt", "Carl Friedrich Gauss", "Ronald A. Fisher", "Alan Turing",            "Tim Berners-Lee", "Jim Gray", "Hadley Wickham"]milestones = [    "John Graunt \n Beginning of statistical analysis",     "Carl Friedrich Gauss \n Development of the least squares method",     "Ronald A. Fisher \n Introduction of variance analysis",     "Alan Turing \n Conceptualization of the Turing Machine",     "Tim Berners-Lee \n Invention of the World Wide Web",     "Jim Gray \n Advances in database technology",     "Hadley Wickham \n Modernization of data analysis tools"]# Custom offsets for each image in the format (x_offset, y_offset)offsets = {    "John Graunt": (1680,0.0005),    "Carl Friedrich Gauss": (1820, 0.0005),    "Ronald A. Fisher": (1920, 0.0005),    "Alan Turing": (1950, 0.001),    "Tim Berners-Lee": (1980, 0.05),    "Jim Gray": (2000, 10),    "Hadley Wickham": (2020, 10),    # Add more offsets for other people if needed}# Set up the figure and axisfig, ax = plt.subplots(figsize=(15, 8))# Plot the data volume over timeax.plot(years, data_volumes, '-o', color='blue')# Set the y-scale to logarithmic to accommodate the wide range of data volumesax.set_yscale('log')ax.set_xlabel('Year')ax.set_ylabel('Global Data Volume (Zettabytes)')ax.set_title('Global Data Volume and Major Contributors')# Insert images and labels for each person at their respective year with the correct data volumebase_image_path = '/xx/datapeople/'  # Replace with your own path# Function to add an imagedef add_image(ax, base_image_path, coord, person_name):    # Read the image    img = plt.imread(image_path)    # Get custom offset for the person    offset_x, offset_y = offsets.get(person_name, (0, 0))    # Create imagebox    imagebox = OffsetImage(img, zoom=0.15)    ab = AnnotationBbox(imagebox, coord, frameon=False, boxcoords="data",                        xybox=(offset_x, offset_y), box_alignment=(1, 1))    ax.add_artist(ab)# Insert images and labels for each personfor i, year in enumerate(years):    coord = (year, data_volumes[i])    person_name = persons[i]    image_path = f'{base_image_path}{person_name}.jpeg'  # Image names match the person's name    add_image(ax, image_path, coord, person_name)    # Add milestone annotations below each image    ax.annotate(milestones[i], xy=coord, xytext=(0, -100), textcoords='offset points',                ha='center', va='top', fontsize=9, arrowprops=dict(arrowstyle="->", color='black'))plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/564869.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaEE企业级分布式高级架构师课程

教程介绍 本课程主要面向1-5年及以上工作经验的Java工程师,大纲由IT界知名大牛 — 廖雪峰老师亲自打造,由来自一线大型互联网公司架构师、技术总监授课,内容涵盖深入spring5设计模式/高级web MVC开发/高级数据库设计与开发/高级响应式web开发…

补充--广义表学习

第一章 逻辑结构 (1)A(),A是一个空表,长度为0,深度为1。 (2)B(d,e),B的元素全是原子,d和e,长度为2,深度为1。 (3)C(b,(c,…

【ESP32S3 Sense接入百度在线语音识别】

视频地址: ESP32S3 Sense接入百度在线语音识别 1. 前言 使用Seeed XIAO ESP32S3 Sense开发板接入百度智能云实现在线语音识别。自带麦克风模块用做语音输入,通过串口发送字符“1”来控制数据的采集和上传。 步骤概括    (1) 在百度云控制端选择“语音…

Spring Cloud四:微服务治理与安全

Spring Cloud一:Spring Cloud 简介 Spring Cloud二:核心组件解析 Spring Cloud三:API网关深入探索与实战应用 文章目录 一、服务注册中心的选型与最佳实践1. 主流服务注册中心概述2. 最佳实践建议(1)、选型建议(2)、高可用性与稳定性1). 高可…

tabs自定义样式

使用el-tabs 去修改样式的话比较麻烦&#xff0c;索性直接用div来制作。 <div class"contain"><div class"tab_wrap"><div :class"[skew, first, active 1 ? isActive: ]" click"tabClick(1)"><span class&quo…

MRC是谁?- 媒体评级委员会 Media Rating Council

在在线广告的世界里&#xff0c;有许多不同的技术和实践用于提供和衡量广告。对于广告商、出版商和营销人员来说&#xff0c;了解这些技术是如何工作的以及如何有效使用这些技术很重要。在这方面发挥关键作用的一个组织是媒体评级委员会&#xff08;MRC&#xff09;。 1. 了解…

Verilog刷题笔记44

题目&#xff1a;Consider the n-bit shift register circuit shown below: 解题&#xff1a; module top_module (input clk,input w, R, E, L,output Q );always(posedge clk)beginif(L1)Q<R;elseQ<(E1)?w:Q;endendmodule结果正确&#xff1a; 注意点&#xff1a; …

深度学习pytorch——GPU加速(持续更新)

使用 .to(device)&#xff0c;以前使用 .cuda() &#xff0c;但是现在基本不使用了。 代码示例&#xff1a; 查看电脑GPU运行情况&#xff1a; 使用Ctrl Shift ESC快捷键&#xff1a;

【前端Vue】HR-saas中台项目开发md文档第1篇:vuex基础-介绍,vuex基础-初始化功能【附代码文档】

HR-saas中台管理项目开发完整教程&#xff08;附代码资料&#xff09;主要内容讲述&#xff1a;vuex基础-介绍,vuex基础-初始化功能,vuex基础-state,vuex基础-mutations,vuex基础-actions,vuex基础-getters。项目课设计&#xff0c;人力资源的环境搭建vue-element-admin的了解和…

01-机器学习概述

机器学习的定义 机器学习是一门从数据中研究算法的科学学科。 机器学习直白来讲&#xff0c; 就是根据已有的数据&#xff0c;进行算法选择&#xff0c;并基于算法和数据 构建模型&#xff0c;最终对未来进行预测。 机器学习就是一个模拟人决策过程的一种程序结构。 机器学…

Arduino智能家居

文章目录 一、接线框图1、下载fritzing 二、Arduino IDE 下载三、实现代码 一、接线框图 1、下载fritzing https://github.com/fritzing/fritzing-app/releases打开的软件界面如下&#xff1a; 二、Arduino IDE 下载 官网地址 P.S. 如果upload代码过程中出现cant open de…

2024-03-24 需求分析-智能问答系统-调研

一. 需求列表 基于本地知识库的问答系统对接外围系统 数字人语音识别二. 待调研的公司 2.1 音视贝 AI智能外呼_大模型智能客服系统_大模型知识库系统_杭州音视贝 (yinshibei.com) 2.2 得助智能 智能AI客服机器人-智能电话机器人客服-电话电销机器人-得助智能 (51ima.com) 2…