大家好,本次分享一款在数据探索中表现出色的工具—Python Lux ,通过自动化可视化和数据分析过程,使得数据探索变得更加快捷方便。
Lux的使用方法非常简单,只需在Jupyter notebook中输入dataframe,Lux就会智能推荐一组基于数据趋势和模式的可视化。在Lux的交互式小部件中,你可以轻松浏览各种可视化,快速理解数据中的信息。不再需要复杂的代码和繁琐的操作,Lux为数据分析提供了一种更为直观和高效的方式。
在本文中,我们将深入介绍Lux Python库的基本功能,助你更好地理解如何利用这一工具简化你的数据探索任务。让我们一起看看Lux如何在实际应用中发挥作用吧。
Lux安装
conda install -c conda-forge lux-api
jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget
出现以下内容,说明Lux已经安装成功,
Lux使用非常简单,只需要提供dataframe即可。
Lux自动探索数据
Lux自动推荐一组可视化,突显数据集中的有趣趋势和模式。
Lux根据数据属性推荐了一组可交互的可视化图表,现在您可以使用它们来进一步探索您的数据集!
Lux自动探索数据+人工干预
我们也可以告诉 Lux 感兴趣的属性和值,基于这个意图,Lux会引导用户朝着他们探索中的潜在下一步。例如,我们可能对数据集中的AverageCost 和 SATAverage 感兴趣。
结果包含两个部分,左侧是我们感兴趣的字段关系图,在右侧,Lux 生成了三组推荐,以单独的标签组织在小部件上:
右侧"Enhance":向当前选择添加一个额外的属性,从根本上突显额外变量如何影响 AverageCost 和 SATAverage 之间的关系。
右侧"Filter":向当前选择添加一个过滤器,同时保持属性(在 X 轴和 Y 轴上)不变。
右侧"Generalize":移除一个属性,以显示更一般的趋势,展示 AverageCost 和 SATAverage 的分布情况。
导出代码进一步探索
选中感兴趣的结果图导出代码进一步探索,如下图,先选中目的图,然后右侧导出,
vis = df.exported[0]
vis
支持导出 matplotlib、altair和vegalite格式代码,
print (vis.to_code("matplotlib"))
print (vis.to_code("altair"))
print (vis.to_code("vegalite"))
例如altair代码,
ref: https://github.com/lux-org/lux
❤️❤️更多干货👇👇👇