SWE-agent是什么
SWE-agent是一个由普林斯顿大学NLP组研究人员开发的开源AI程序员和软件工程师系统,利用大型语言模型(如GPT-4)的能力,可以自动解决GitHub存储库中的问题。SWE-agent通过智能体-计算机接口(ACI)与代码库交互,能够执行代码的浏览、编辑、测试和执行等任务。该系统在SWE-bench测试集上展现出与闭源AI程序员Devin相似的准确度,平均93秒解决一个问题,实现了SOTA 性能。
在25%的SWE-bench测试集上,SWE-agent 实现了与 Devin相似的准确度—— 解决了12.29%的问题。SWE-agent目前已在GitHub上开源,研究论文将于4月10日发布。

SWE-agent的官网入口
官方项目主页:https://swe-agent.com/ GitHub源码库:https://github.com/princeton-nlp/SWE-agent 官方在线Demo:https://swe-agent.com/demoSWE-agent的主要功能
Pull Request问题解决:SWE-agent能够理解GitHub存储库中的问题,并尝试通过创建拉取请求(pull request)来修复这些问题。代码编辑与修复:SWE-agent能够浏览和编辑代码库中的文件,自动修复代码中的错误和漏洞。 自动语法检查:在代码编辑过程中,SWE-agent可以运行linter(代码检查工具),确保代码符合语法规范。文件查看器:提供了一个专门构建的文件查看器,能够在每轮显示100行代码,支持上下滚动和搜索功能,以便更有效地查看和编辑代码。 全目录字符串搜索:SWE-agent具备全目录字符串搜索功能,能够简洁地列出所有匹配搜索条件的文件和代码片段。 命令与反馈:通过智能体-计算机接口(ACI),SWE-agent能够接收和执行以自然语言形式给出的命令,并提供相应的反馈。测试编写与执行:SWE-agent能够编写并执行测试代码,验证修复的有效性。