How Far Can We Go with Practical Function-Level Program Repair? 论文笔记-编程知识

How Far Can We Go with Practical Function-Level Program Repair? 论文笔记

news/2025/3/10 0:56:31/文章来源:https://www.cnblogs.com/mianmaner/p/18761724

介绍

(1) 背景

现有的很多基于 LLM 的 APR 方法针对的是 single-line 或者代 hunk-level 的程序修复，但它们通常依靠语句级别的故障定位技术。然而，人们普遍认为，准确识别陈述级的断层基本上可能是代价高昂的，即要求细粒度的输入或强有力的假设，从而有可能限制它们的适用性。另一方面，基于 LLM 的 function-level APR 可能更有前途，即通过将 Buggy 函数提示到 LLM 中来自动地重新注册生成了该错误函数的整个修复版本

function-level APR 的优点：(1) 修复范围大，不仅涉及单行和块级的代码修复，还涉及一个更复杂的任务，可以在功能中维修多个不连续的 lines 或 hunks；(2) 成本效益更高，无需语句级别的精确故障定位，只需定位到函数级别

(2) 挑战

现有的基于 LLM 的 APR 技术在 function-level 中表现出明显的性能损失，例如，ChatRepair 降低 33％，而 CodexRepair 降低 36.4％
缺乏对某些常用机制对于 function-level APR 的有效性的研究和验证，例如 few-shot learning 以及合并与代码修复相关的辅助信息等等

在本文的研究中，产生和验证了超过 1000 万个补丁，消耗了 8,000 多个GPU和 100,000 个 CPU 小时。据作者描述这是迄今为止对 LLM 的 APR 进行的最大的实证研究

(3) 贡献

对 function-level APR 进行了首次的广泛研究
发现具有 zero-shot learning 的 LLM 已经具有 function-level APR 的能力，并且合并辅助信息可以大大提升修复性能
提出了 SRepair，实现了 SOTA 并且首次实现了多功能错误的修复

实证研究

(1) RQ1: 基于 LLM 的功能级 APR 如何在 zero-shot 和 few-shot 下进行？

进行了 k-shot 的实验，具体实验设置见下图

(2) RQ2: 不同的辅助维修信息如何影响基于 LLM 的功能级 APR 的性能？

不同的辅助信息具体如下图所示，作者在不同设置下进行了实验

方法

SRepair 提示 LLM 具有错误的功能和辅助维修相关的信息（即触发测试，错误消息和注释），以识别错误的根本原因，并以自然语言相应地生成维修建议。然后再将建议提供给补丁生成模型

总结

主要贡献还是在于 funtion-level APR 的实证研究，提出的 SRepair 方法感觉比较简单朴素

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/896181.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Ubuntu安装最新版本的cmake

Ubuntu安装最新版本的cmake

1、下载地址 Index of /files/LatestRelease ，目前最新的是3.31.6 或者命令行方式下载wget https://cmake.org/files/LatestRelease/cmake-3.31.6-linux-x86_64.tar.gz2、解压tar -zxvf cmake-3.31.6-linux-x86_64.tar.gz3、替换已有的cmake，mv命令必须目标路径为空，所以使用…

阅读更多...

[AI/GPT] Anything-LLM : (MIT)

[AI/GPT] Anything-LLM : (MIT)

概述： Anything LLM 简述一体式桌面和Docker AI应用程序，内置RAG、AI代理、无代码代理构建器等。urlhttps://anythingllm.com https://github.com/Mintplex-Labs/anything-llm20250220 : 3.7k fork / 38.1K star创建公司：Mintplex Labs Inc.创立时间：2023年12月（首次公开）…

阅读更多...

再次认识java反射

再次认识java反射

一、概述在认识java反射之前我们先来认识一下什么是动态语言与静态语言。动态语言是一类在运行时可以改变其结构的语言：例如新的函数、对象、甚至代码可以被引进，已有的函数可以被删除或是其他结构上的变化。通俗点说就是在运行时代码可以根据某些条件改变自身结构。主要…

阅读更多...

【问题】HashMap的computeIfAbsent方法丢失数据问题分析

【问题】HashMap的computeIfAbsent方法丢失数据问题分析

问题背景前段时间碰到客户问题发现是 ConcurrentHashMap的computeIfAbsent导致死循环（ConcurrentHashMap死循环问题分析）就很好奇HashMap的computeIfAbsent会不会也有问题，一试之下发现确实存在问题，相同的代码在HashMap中会丢失插入的数据。发生原因【循环添加】时，如…

阅读更多...

CFA学习

CFA学习

定量分析利率利率的定义：被认为是 ① 平衡借贷双方的平衡点（equilibrium interest rates）② 贴现率（货币的时间价值）③ 机会成本利率的组成：通货膨胀➕各种风险计算【现值/终值】用时间轴确实一目了然！ # 经济学 # 财务报表分析 # 公司理财 # 投资组合管理 # 权益投…

阅读更多...

INFINI Labs 产品更新 | Easysearch 增加异步搜索等新特性

INFINI Labs 产品更新 | Easysearch 增加异步搜索等新特性

INFINI Labs 产品更新发布！此次更新，Easysearch 增加了新的功能和数据类型，包括 wildcard 数据类型、Point in time 搜索 API、异步搜索 API、数值和日期字段的 doc-values 搜索支持，Console 新增了日志查询功能。 INFINI Easysearch v1.11.0 INFINI Easysearch 是一个分布…

阅读更多...

语法trick

语法trick

for (int i = 1; i <= n; ++i) {cout << dist[i] << " \n"[i == n];}

阅读更多...

百万架构师第四十七课：并发编程的原理(二)｜JavaGuide

百万架构师第四十七课：并发编程的原理(二)｜JavaGuide

原文链接 JavaGuide《并发编程的艺术》并发编程的实现原理目标上节课内容回顾 synchronized 原理分析 wait 和 notify Lock 同步锁回顾原子性可见性有序性JMM JMM 是 JAVA 里边定义的内存模型。定义了多线程和我们内存交互的规范。屏蔽了硬件和操作系统访问内存的差异。…

阅读更多...

[极客大挑战 2019]Havefun 1

[极客大挑战 2019]Havefun 1

进网站显示一只猫，于是看源代码发现下面有注释所以在后面加上/index.php?cat=dog即可（小猫可爱捏）

阅读更多...

3.9 一些有意思的

3.9 一些有意思的

1

阅读更多...

提取excel中的图片

提取excel中的图片

需求：提取excel中嵌入单元格的图片实现思路：用pandas读取文件，对于嵌入图片的单元格则会显示其函数问题：wps与office嵌入方法有所不同，wps使用函数嵌套，而office则是设置随单元格大小变动，对于后者，会被视为是悬浮的图片，使用pandas无法提取任何一张图片源文件如…

阅读更多...

2019年-PTA模拟赛-L2-1 链表去重(一维数组模拟链表)

2019年-PTA模拟赛-L2-1 链表去重(一维数组模拟链表)

一维数组模拟链表一维数组模拟链表被删除的结点仍然在e数组中，因此记录一下被删除的结点的地址就可以找到其值AcCode: #include<bits/stdc++.h> using namespace std; int e[100010], ne[100010], vis[100010]; vector<int> delNode; int main(){int N, rootAdre…

阅读更多...

推荐文章

最新文章