OpenDevin 简介：一个有抱负的 AI 驱动的软件开发平台-编程知识

OpenDevin 简介：一个有抱负的 AI 驱动的软件开发平台

news/2025/1/22 23:43:54/文章来源:https://www.cnblogs.com/IcyFeather/p/18292558

来源链接：https://medium.com/ai-advances/introduction-to-opendevin-the-aspiring-ai-powered-software-development-platform-11ffc69e60cc

发布时间：2024-05-05T00:40:39.078Z

OpenDevin 是一个创新的开源项目，旨在通过引入一个自主的 AI 软件工程师来彻底改变软件开发。这个 AI 助手旨在处理复杂的工程任务，并与人类用户在各种软件项目上积极合作。该项目正在开发中，但已经发布的 alpha 版本清楚地展示了协作式 AI 开发的激动人心的未来。

更多详情请参阅：

OpenDevin 的核心功能：它能做什么（或至少它渴望做什么）
开始使用 OpenDevin
理解 OpenDevin 的架构
OpenDevin 的代理：专业化的 AI 助手
OpenDevin 的潜在应用
结论

OpenDevin 的核心功能：它能做什么（或至少它渴望做什么）

想象一下有一个不知疲倦的队友，能够处理复杂的编码任务，理解你的意图，并在过程中提供建议和解释。这就是 OpenDevin 的潜在未来。该项目旨在创建一个全面的 AI 助手，能够：

自动化重复任务： OpenDevin 旨在处理各种编码杂务，包括生成代码、修复错误和重构现有代码，让开发者能够专注于项目的战略方面。
像伙伴一样协作： OpenDevin 不仅仅是一个自动化工具；它努力成为一个协作伙伴。它将通过自然语言处理理解你的意图，并提供智能建议、解释和针对你特定需求的代码示例。
持续学习和适应： OpenDevin 渴望成为一个快速学习者：通过与用户互动和分析过去的项目，它被设计为不断改进其性能并适应不同的编码风格和项目要求。

开始使用 OpenDevin

OpenDevin 主要在一个 Docker 容器内运行，为其操作提供了一个受控环境。以下是一个基本的入门指南：

设置你的工作区： 选择一个 OpenDevin 可以访问和修改你的代码的目录。
配置你的 LLM： 通过设置相关环境变量（如 LLM_API_KEY 和 LLM_MODEL）选择并配置你想要的大型语言模型（LLM）。OpenDevin 支持多种 LLM，包括 GPT-4、Claude、Azure OpenAI、Google Gemini/Vertex 和本地模型，如 Ollama 提供的模型。
运行 OpenDevin： 使用提供的 Docker 命令和适当的环境变量启动 OpenDevin。
访问界面： 运行后，OpenDevin 可以通过 http://localhost:3000 上的网页界面访问。

如文档所示，启动只需使用以下代码行：

export WORKSPACE\_BASE=$(pwd)/workspace; # 你希望 OpenDevin 修改的目录。必须是绝对路径！docker run \\  --pull=always \\  -e SANDBOX\_USER\_ID=$(id -u) \\  -e WORKSPACE\_MOUNT\_PATH=$WORKSPACE\_BASE \\  -v $WORKSPACE\_BASE:/opt/workspace\_base \\  -v /var/run/docker.sock:/var/run/docker.sock \\  -p 3000:3000 \\  --add-host host.docker.internal=host-gateway \\  ghcr.io/opendevin/opendevin:0.5

一个重要的提示：虽然OpenDevin在Docker沙箱中运行以实现隔离，但请确保您选择的工作空间目录已备份，因为在操作过程中文件可能会被修改或删除！

另外，需要注意的是，OpenDevin将向配置的LLM发出许多提示，这可能会产生费用。因此，设置消费限额和监控使用情况是至关重要的。

理解OpenDevin的架构

OpenDevin的系统架构由两个主要部分组成：

前端： 这是用户界面，开发者在这里与OpenDevin互动。它允许用户输入任务，查看代码建议和管理项目设置。

后端： 这个组件处理OpenDevin的核心功能，包括：

LLM交互： 向选择的LLM发送提示并接收响应。
代理执行： 利用各种代理处理信息并执行操作。
工作空间管理： 与指定工作空间目录中的代码交互。

它们的相互连接以及构建块在以下图像中显示。

OpenDevin的架构

OpenDevin系统架构的关键组件包括：

聊天界面： 与聊天应用程序交互的用户界面
应用： 包含各种子组件以提供用户体验的主要组件
settingsService： 管理用户偏好和个性化选项
chatService： 处理核心聊天功能（消息传输、加密、存储）
socket： 启用前端和后端之间的实时通信
客户端WS： 客户端的WebSocket，用于实时数据交换
服务器WS： 服务器端的WebSocket，用于实时数据交换
VITE_TERMINAL_WS_URL： 指定WebSocket连接的网络地址的配置元素
AgentController： 管理自动化代理或聊天机器人，用于智能聊天功能

OpenDevin的代理：专业的AI助手

OpenDevin使用不同的代理，每个代理都具有独特的能力来处理特定任务：

CodeAct代理： CodeAct代理体现了将LLM代理的行动整合到统一的代码操作空间的概念。这个代理可以与用户对话，执行Linux bash命令，并通过交互式解释器运行Python代码。它利用OpenDevin的插件系统，包括Jupyter插件用于IPython执行和SWE-agent工具插件用于软件开发任务。以下图像展示了这个代理的操作。

Monologue Agent 独白代理： 独白代理利用长期和短期记忆的力量高效完成任务。它将长期记忆存储为 LongTermMemory 对象，使模型能够从过去搜索相关示例。短期记忆作为 Monologue 对象进行维护，模型可以根据需要进行压缩。该代理支持多种操作，包括运行命令、读写文件、回忆信息、浏览网址和推送至 GitHub。
Planner Agent 规划代理： 规划代理采用独特的提示策略来制定解决问题的长期计划。它接收每一步的先前动作-观察对、当前任务以及基于最后执行动作的提示。该代理检查当前步骤是否完成，并返回 AgentFinishAction 或创建计划提示发送给模型进行推理。