Phind-CodeLlama-34B-v2 + Excel + Python 超强组合玩转数据分析
- 0. 背景
- 1. 使用 Phind-CodeLlama-34B-v2 + pandas 实现数据导入和导出
- 1.1 使用 Phind-CodeLlama-34B-v2 + pandas 导入 Excel 文件中的数据
- 1.2 使用 Phind-CodeLlama-34B-v2 + pandas 读取部分Excel文件数据
- 2. 使用 Phind-CodeLlama-34B-v2 + pandas 实现单个文件数据的整理
- 2.1 使用 Phind-CodeLlama-34B-v2 + pandas 实现列操作
- 2.2 利用已有列数据通过简单计算得到新列
0. 背景
购买了一本 “智能分析 - ChatGPT + Excel + Python 超强组合玩转数据分析” 的书籍,是基于 ChatGPT 3.5 编写的。
最近开源大语言模型 Mixtral 8*7B
的性能不错,那今天就试试 Mixtral 8*7B
能不能实现同样的效果。
Mixtral 8*7B
的测试结果不是很满意,接下来用 Phind-CodeLlama-34B-v2
测试一下试试。
注意:这篇文章主要是为了测试
Phind-CodeLlama-34B-v2
的性能,出于版权关系和对作者成果的尊重,今天的尝试仅使用部分书中的提示词,看看能不能生成对应的 Python 代码。(如果大家觉得书中的内容会对自己的工作有帮助的话,可以去一些网购平台自行购买,支持一下原作者。)
1. 使用 Phind-CodeLlama-34B-v2 + pandas 实现数据导入和导出
1.1 使用 Phind-CodeLlama-34B-v2 + pandas 导入 Excel 文件中的数据
执行结果如下,
1.2 使用 Phind-CodeLlama-34B-v2 + pandas 读取部分Excel文件数据
和原文比较,额外加了 (使用usecols参数时,应避免使用lambda函数)
这段提示词,避免 usecols 参数使用 lambda 函数出错 。
执行结果如下,
2. 使用 Phind-CodeLlama-34B-v2 + pandas 实现单个文件数据的整理
2.1 使用 Phind-CodeLlama-34B-v2 + pandas 实现列操作
生成的代码存在问题,先执行了 输出前5行数据
,而不是先 在导入的数据最后添加一列“交通补助”,该列的值均为600。
。
2.2 利用已有列数据通过简单计算得到新列
执行结果如下,
结论上 Phind-CodeLlama-34B-v2 生成的代码偶尔是有错误的,所以不继续测试了。
完结!