一、介绍
CodeFuse
是蚂蚁集团自研的代码生成模型,能提供智能建议和实时支持,帮助开发者自动生成代码、注释、测试用例等,提高研发效率。在评测中,CodeFuse的得分超过了GPT-4和WizardCoder-34B。开源内容包括代码框架和模型。代码框架支持多任务微调,包括代码生成、翻译、测试用例生成等任务。
模型包括CodeFuse13B-4K 和CodeFuse-CodeLlaMa34B-MFT。CodeFuse早在6月开始内测,可用于开发助手、IDE插件等应用场景。
CodeFuse的使命是开发专门设计用于支持整个软件开发生命周期的大型代码语言模型(Code LLMs),涵盖设计、需求、编码、测试、部署、运维等关键阶段。我们致力于打造创新的解决方案,让软件开发者们在研发的过程中如丝般顺滑。
二、技术深度
多任务微调框架(MFT)
:CodeFuse采用的多任务微调框架,支持代码生成、翻译、测试用例生成等多达十余项任务。这一框架支持蚂蚁自研模型,以及多个开源大模型的代码能力微调。MFT框架内含创新的微调数据打包技术,号称可提升微调速度约8倍;并使用多重部署优化技术,使推理加速约2倍。
程序分析校验技术
:在模型训练过程中,CodeFuse使用了程序分析校验技术,对高质量代码数据进行筛选,并构建了代码领域专用字典,使编码平均长度低10%以上。这一技术确保了生成代码的准确性和高效性。
三、产品功能
四、VAT人机协同的软件研发新范式
CodeFuse VAT
(Virtual Agent Team)致力于打造人机协同的软件研发新范式,助力软件研发效能的提升。基于大模型技术,构建覆盖软件研发全生命周期的多智能体协同的智能研发体系。通过人机协同模式,重塑研发生命周期各个环节, 可以极大程度的提升需求理解、功能设计、代码开发、质量测试、部署上线等各个环节的效率和质量。
五、企业智能研发解决方案
CodeFuse VAT在企业自身研发流程基础上,基于大模型技术,通过对企业研发各工种Agent的构建、企业私有知识库的嵌入、集成企业DevOps工具套件等,实现企业研发全链路的智能升级。同时打造“AI+人工”的分布式共享服务平台,提供人机协同的智能研发交付服务,为企业软件研发提供全方位效能提升的AI解决方案。
六、智能研发产品
我们专注于智能研发领域,推出了一系列面向企业及开发者的智能研发产品,帮助提升研发效率。例如:CodeFuse IDE插件、AI原生的CodeFuse IDE,ToB的企业智能研发Agent服务、企业智能研发交付平台等。同时,蚂蚁对自研的代码大模型 CodeFuse 进行了开源,诚邀志同道合的工程师和研究人员加入这个社区,共同构建和增强 CodeFuse。
七、软件开发审查员
依托大模型技术,我们致力于构建一个高效、可靠的人机协同的软件开发生态系统,以迎接未来更加复杂的技术挑战。在该模式下,我们重新定义了软件开发角色-软件开发审查员。利用审查员自身的专业知识和经验,对大模型生成的设计稿或代码等进行细致的评估与调整,即机器生成-人来审查的协同模式,帮助提升软件开发各环节的研发质量及研发效率。
八、应用场景
CodeFuse 是一个代码审查工具,主要用于提高软件开发过程中代码的质量和安全性。
以下是 CodeFuse 的一些典型应用场景:
代码审查
:在代码合并到主分支之前,使用 CodeFuse 对代码进行自动化审查,确保代码符合既定的编码标准和安全规范。
早期漏洞检测
:在软件开发周期的早期阶段,通过 CodeFuse 发现潜在的代码缺陷和安全漏洞,降低后续修复成本。
团队协作
:CodeFuse 可以帮助团队成员理解代码库中的变更,促进知识共享和团队协作。
教育和培训
:教育机构可以使用 CodeFuse 帮助学生理解代码质量的重要性,通过实践学习如何编写更安全、更高效的代码。
开源项目维护
:开源项目维护者可以使用 CodeFuse 来保证社区贡献的代码质量,维护项目的健康和可持续性。
持续集成/持续部署(CI/CD)
:将 CodeFuse 集成到 CI/CD 流程中,确保每次代码提交都不会引入新的问题。
合规性检查
:对于需要遵守特定行业标准的组织,CodeFuse 可以帮助确保代码符合这些标准。
技术债务管理
:通过 CodeFuse 分析代码库,识别和跟踪技术债务,帮助团队优先处理最关键的问题。
跨语言项目管理
:对于使用多种编程语言的项目,CodeFuse 提供统一的审查标准,帮助维护跨语言的代码质量。
快速反馈循环
:开发者提交代码后,CodeFuse 可以快速提供反馈,加快开发进程。
使用 CodeFuse 或类似工具,有助于提升软件开发的整体效率,减少人为错误,对于提升软件项目的稳定性和可维护性具有重要意义。
项目🔗
https://github.com/codefuse-ai