Python智能挖掘数据新秘器

大家好,本次分享一款在数据探索中表现出色的工具—Python Lux ,通过自动化可视化和数据分析过程,使得数据探索变得更加快捷方便。

Lux的使用方法非常简单,只需在Jupyter notebook中输入dataframe,Lux就会智能推荐一组基于数据趋势和模式的可视化。在Lux的交互式小部件中,你可以轻松浏览各种可视化,快速理解数据中的信息。不再需要复杂的代码和繁琐的操作,Lux为数据分析提供了一种更为直观和高效的方式。

在本文中,我们将深入介绍Lux Python库的基本功能,助你更好地理解如何利用这一工具简化你的数据探索任务。让我们一起看看Lux如何在实际应用中发挥作用吧。


Lux安装

conda install -c conda-forge lux-api
jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget

出现以下内容,说明Lux已经安装成功,


Lux使用非常简单,只需要提供dataframe即可。

Lux自动探索数据

Lux自动推荐一组可视化,突显数据集中的有趣趋势和模式。

Lux根据数据属性推荐了一组可交互的可视化图表,现在您可以使用它们来进一步探索您的数据集!


Lux自动探索数据+人工干预

我们也可以告诉 Lux 感兴趣的属性和值,基于这个意图,Lux会引导用户朝着他们探索中的潜在下一步。例如,我们可能对数据集中的AverageCost 和 SATAverage 感兴趣。

结果包含两个部分,左侧是我们感兴趣的字段关系图,在右侧,Lux 生成了三组推荐,以单独的标签组织在小部件上:

右侧"Enhance":向当前选择添加一个额外的属性,从根本上突显额外变量如何影响 AverageCost 和 SATAverage 之间的关系。

右侧"Filter":向当前选择添加一个过滤器,同时保持属性(在 X 轴和 Y 轴上)不变。

右侧"Generalize":移除一个属性,以显示更一般的趋势,展示 AverageCost 和 SATAverage 的分布情况。 


导出代码进一步探索

选中感兴趣的结果图导出代码进一步探索,如下图,先选中目的图,然后右侧导出,

vis = df.exported[0]
vis

支持导出 matplotlib、altair和vegalite格式代码,

print (vis.to_code("matplotlib"))
print (vis.to_code("altair"))
print (vis.to_code("vegalite"))

例如altair代码,

ref: https://github.com/lux-org/lux

❤️❤️更多干货👇👇👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/417257.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 设计者模式以及与Spring关系(三) 原型和适配器模式

简介: 本文是个系列一次会出两个设计者模式作用,如果有关联就三个,除此外还会讲解在spring中作用。 23设计者模式以及重点模式 我们都知道设计者模式有3类23种设计模式,标红是特别重要的设计者模式建议都会,而且熟读于心&#…

数据结构与算法教程,数据结构C语言版教程!(第五部分、数组和广义表详解)二

第五部分、数组和广义表详解 数组和广义表,都用于存储逻辑关系为“一对一”的数据。 数组存储结构,99% 的编程语言都包含的存储结构,用于存储不可再分的单一数据;而广义表不同,它还可以存储子广义表。 本章重点从矩阵…

探秘网络爬虫的基本原理与实例应用

1. 基本原理 网络爬虫是一种用于自动化获取互联网信息的程序,其基本原理包括URL获取、HTTP请求、HTML解析、数据提取和数据存储等步骤。 URL获取: 确定需要访问的目标网页,通过人工指定、站点地图或之前的抓取结果获取URL。 HTTP请求&#…

行政快递管理软件使用教程

勤勤恳恳的行政人员,还在努力地修改企业快递管理制度,而聪明的行政人员,已经开始物色合适的快递管理软件了。随着企业管理的现代化发展,我们会发现很多管理模块都有相应的管理制度。人力资源管理、客户关系管理、财务管理等等&…

【LeetCode: 295. 数据流的中位数 + 堆】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

Python中如何简化if...else...语句

一、引言 我们通常在Python中采用if...else..语句对结果进行判断,根据条件来返回不同的结果,如下面的例子。这段代码是一个简单的Python代码片段,让用户输入姓名并将其赋值给变量user_input。我们能不能把这几行代码进行简化,优化…

beego API 自动化文档

API 全局设置 必须设置在 routers/router.go 中,文件的注释,最顶部: // APIVersion 1.0.0 // Title mobile API // Description mobile has every tool to get any job done, so codename for the new mobile APIs. // Contact astaxiegmai…

LLMs之Vanna:Vanna(利用自然语言查询数据库的SQL工具+底层基于RAG)的简介、安装、使用方法之详细攻略

LLMs之Vanna:Vanna(利用自然语言查询数据库的SQL工具底层基于RAG)的简介、安装、使用方法之详细攻略 目录 Vanna的简介 1、用户界面 2、RAG vs. Fine-Tuning 3、为什么选择Vanna? 4、扩展Vanna Vanna的安装和使用方法 1、安装 2、训练 (1)、使用…

Transformer|对图像数据构造patch序列+VIT整体架构解读(需进一步完善)

Attention在视觉的作用 使其关注到所值得关注的。 ViT(Vision transformer) 比如说图像是一个30x30x3的大小,可以将其拆分成9个10x10x3的部分,每个部分可以继续将10x10x3的部分拆解成300x1的向量来代表自己。(通常情…

单元测试之Stub和Mock

实例 Analyze类会检查filename的长度,如果小于8,我们就会使用一个实现IWebService的类来记录错误. 我们需要给Analyze方法写单元测试。 public class LogAnalyzer {private IWebService service;private IEmailService email;public IWebService Serv…

C++类与对象【运算符重载】

🌈个人主页:godspeed_lucip 🔥 系列专栏:C从基础到进阶 🎄1 运算符重载🌽1.1 加号运算符重载🌽1.2 左移运算符重载🌽1.3 递增运算符重载🌽1.4 赋值运算符重载&#x1f33…

信道复用技术码分复用 CDM(Code Division Multiplexing)

目录 一、码分复用 CDM(Code Division Multiplexing) 二、码分多址CDMA 三、码片序列的概念 四、码片序列的正交关系 五、CDMA的工作原理 一、码分复用 CDM(Code Division Multiplexing) 常用的名词是码分多址 CDMA (Code Di…