OpenAI GPT-4 Code Interpreter测试

news/2025/2/19 6:52:17/文章来源:https://blog.csdn.net/m0_56661101/article/details/131654361

OpenAI GPT-4 Beta版本Code Interpreter功能分析

OpenAI最近在GPT-4中推出了Code Interpreter功能的Beta版本，它是ChatGPT的一个版本，可以编写和执行Python代码，并处理文件上传。以下是对其表现的基本分析。

GPT-4 Code Interpreter

主要功能

文件信息获取：Code Interpreter可以从文件名获取相关信息，并使用生成的Python代码对提供的文件类型进行处理。例如，PDF文件将被解析为文本，而PNG图片将被压缩后输入（目前还不清楚输入的具体格式）。
Python代码生成：Code Interpreter会根据输入文件的类型生成相应的代码，输出包括STDOUT和STDERR，以及处理结果RESULT。这些内容都会被折叠展示。
超出Token Limit的内容处理：Code Interpreter利用生成的外部工具检索和摘取用户所需的内容部分，这部分内容会作为输入，其余内容则作为文件缓存，不会被直接读取。

功能测试

针对不同的文件类型，进行了Code Interpreter功能的测试。

图表（png）

Code Interpreter从文件名获取相关信息，可能有系统提示帮助模型注意到文件名。但是在处理图片过程中，图片被压缩，可能导致复杂视觉表格图片内容无法正确读取。
PNG Test

长文本（pdf）

对于PDF文件，Code Interpreter生成简单的代码并执行，例如使用PyPDF2处理PDF文件，并输出处理后的内容，包括STDOUT、STDERR和结果RESULT。

选取了较靠后的段落（超过Token限制）来检查GPT-4的Token分配情况。测试结果表明，GPT-4并未直接读取整个文件，而是引导用户选择一部分内容。然后，GPT-4会生成外部工具，利用这个工具检索和摘取用户指定的内容，将结果作为Context传入模型，结合用户的Prompt进行处理。

PDF Test
PDF Test - Detailed

短代码（ipynb）

对于短代码文本，GPT-4的Code Interpreter可以生成简单的解析工具获取文本，并将文本作为RESULT输入模型。
ipynb Test

长代码 (C++)

然而，对于长度超过最大Token数量的长文本代码，GPT-4的Code Interpreter未能正确输出完整的代码，只输出了其中一部分，并将这部分代码作为Context载入模型。

这就说明，对于长度超过Token Limit的文本，GPT-4的Code Interpreter功能仍有局限性。
Long Code Test
Long Code Test - Result

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/19137.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Blender基础入门（0）：下载和资源

Blender基础入门（0）：下载和资源

文章目录我个人的Blender专栏前言相关资料Blender和C4D如何选择视频资源BlenderBlender官网下载基础设置常用快捷键介绍空格键：跳出选择框ShiftA：跳出添加框选中物体按F9:显示物体属性 Blender能做到什么总结我个人的Blender专栏 Blender简单教学前…

阅读更多...

冯诺依曼结构和操作系统的理解

冯诺依曼结构和操作系统的理解

在正式讲解进程之前，需要先铺垫一些基本知识. 目录冯诺依曼结构操作系统冯诺依曼结构这个名词相信大家非常熟悉，我们常见的计算机，如笔记本。我们不常见的计算机，如服务器，大部分都遵守冯诺依曼体系。这张图…

阅读更多...

从零开始学习自动驾驶决策规划

从零开始学习自动驾驶决策规划

从零开始学习自动驾驶决策规划从入门到掌握的一系列讲解，其中涵盖的内容如下： 前言课第一节-ros工程的创建第一节-运行环境和工程目录简介第二节-工程运行和小车模型搭建简介第二节-车辆里程计第三节-整体架构思路第三节-地图路线构建方法第三节…

阅读更多...

Spring Cache （基础知识+瑞吉外卖项目）

Spring Cache （基础知识+瑞吉外卖项目）

Spring Cache 基本介绍 Spring Cache是一个框架，实现了基于注解的缓存功能，只需要简单地加一个注解，就能实现缓存功能。 Spring Cache提供了一层抽象，底层可以切换不同的cache实现。具体就是通过CacheManager接口来统一不同的缓…

阅读更多...

基于github制作个人学术网站（主页）

基于github制作个人学术网站（主页）

模板首先找到一个学术模板，fork到远程仓库。academicpages，如果不是很清楚具体的步骤，可以参考保姆级教程。在github上对该网站代码修改不是很方便，肯定是在本地进行更新后push到远程仓库。本地Git 学会下载和安装就行&#…

阅读更多...

基于高斯混合模型聚类的风电场短期功率预测方法（Pythonmatlab代码实现）

基于高斯混合模型聚类的风电场短期功率预测方法（Pythonmatlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…

阅读更多...

正则表达式测试（二）

正则表达式测试（二）

一、中括号的语法匹配所有的字符，返回一个数组,包含匹配的所有字符内容，按顺序展开； 注意：空格也会被匹配到匹配所有符合的字符，返回一个数组。匹配空白字符匹配非空白字符匹配空白字符非空白字符如上所示&am…

阅读更多...

生成式AI：大语言模型ChatGPT交互的机制

生成式AI：大语言模型ChatGPT交互的机制

推荐：将NSDT场景编辑器加入你的3D工具链 3D工具集：NSDT简石数字孪生与 ChatGPT 有效交互的快速工程随着生成式人工智能的普及，特别是 ChatGPT，提示已成为人工智能世界中越来越重要的技能。制作提示，与大型语言模型&…

阅读更多...

SIP业务之BLF

SIP业务之BLF

BLF（Busy Lamp Field）是SIP应用中的一项重要业务，用来监视目标号码的状态，常用于调度、坐席监控等场景。一、 BLF原理 BLF功能需要IP终端或话机与SIP服务器协同实现的，主要流程如下： IP话机向SIP服务器发…

阅读更多...

ByteBuddy学习笔记

ByteBuddy学习笔记

ByteBuddy 1.ByteBuddy的用途 ByteBuddy通过修改字节码来新增、修改、删除Java类的现有功能，主要用于分离功能代码和非功能代码，比如比如非功能代码如下： public double calculatePrice(){double discount getDiscount();double price …

阅读更多...

嵌入式软件测试笔记10 | 嵌入式软件测试中如何进行安全性分析？

嵌入式软件测试笔记10 | 嵌入式软件测试中如何进行安全性分析？

10 | 嵌入式软件测试中如何进行安全性分析？ 1 简介2 故障模型及后果分析（FMEA）2.1 三个步骤2.2 带来的结果优势2.3 FMEA分析过程2.3.1 描述系统及其功能2.3.2 识别潜在的故障模式2.3.3 故障模式对功能的影响2.3.4 风险导致后果的原因2.3.5 风…

阅读更多...

Django基础入门⑮:更新书籍信息删除书籍条目信息 Django静态文件配置

Django基础入门⑮:更新书籍信息删除书籍条目信息 Django静态文件配置

Django基础入门⑮:更新书籍信息删除书籍条目信息 Django静态文件配置更新书籍信息删除书籍条目信息Django静态文件配置 🏘️🏘️个人简介：以山河作礼。 🎖️🎖️:Python领域新星创作者，CSDN实力新星认证&…

阅读更多...

推荐文章

最新文章