DeepSWE

DeepSWE – Together.ai联合Agentica开源的AI Agent框架

DeepSWE是一款由Together.ai与Agentica携手打造的开源AI Agent框架，它基于Qwen3-32B模型，运用强化学习技术精心雕琢而成。DeepSWE在SWE-Bench-Verified基准测试中展现出卓越性能，在使用测试时扩展（TTS）技术后，准确率高达59.0%，即使不使用TTS，Pass@1准确率也达到了42.2%，傲视群雄，位居开源Agent框架榜首。

## DeepSWE：智能软件助手

DeepSWE，一个由Together.ai和Agentica共同孕育的开源AI Agent框架，它不仅仅是一个工具，更是一位智能软件助手。它基于强大的Qwen3-32B模型，并通过强化学习的锤炼，具备了强大的代码理解、问题解决、自动化测试以及多步骤推理能力。DeepSWE的诞生，旨在推动强化学习在软件工程领域的应用，助力开发者更高效地构建和维护软件系统。

## 主要功能：

代码洞察与修改：DeepSWE能够深入理解现有代码，并进行精准的修改，从而修复软件缺陷或实现新功能。
问题攻克：它能够解决复杂的软件工程问题，例如修复GitHub上的问题，实现新代码功能，以及进行调试等。
自动化测试与验证：DeepSWE能够自动执行代码构建和测试，验证解决方案的有效性，确保代码修改不会影响现有功能。
多步推理：在解决任务时，DeepSWE能够进行多步骤推理和决策，逐步优化解决方案，直至任务圆满完成。

## 产品官网：

由于DeepSWE是开源项目，其核心信息和模型可在以下平台获取：

HuggingFace模型库：https://huggingface.co/agentica-org/DeepSWE-Preview

## 应用场景：

代码质量提升：DeepSWE能自动理解和修改代码，快速定位并修复漏洞、优化性能，重构代码结构，显著提升代码质量。
软件问题解决：高效处理GitHub上的问题、实现新功能及将复杂任务分解为可管理的子任务，进而快速解决软件工程难题。
自动化测试：DeepSWE能够自动生成测试用例，执行代码构建和自动化测试，进行回归测试，确保软件的稳定性和可靠性。
智能优化：基于多步骤推理解决复杂问题，不断迭代优化解决方案，提升软件的适应性和可持续性。
开发协作赋能：DeepSWE为开发人员提供实时代码建议和补全提示，促进团队协作，提高开发效率。

## 常见问题：

由于DeepSWE是开源项目，用户在使用过程中可能会遇到一些问题，以下是一些常见问题及解答：

如何获取DeepSWE？ DeepSWE的模型和代码均已开源，开发者可以在Hugging Face模型库中下载和使用。
DeepSWE的训练过程是怎样的？ DeepSWE完全基于强化学习训练，不依赖于其他专有模型。它通过与环境的交互，学习在复杂的软件工程任务中做出最优决策。
DeepSWE的优势是什么？ DeepSWE在SWE-Bench-Verified基准测试中表现出色，尤其是在使用TTS技术后，准确率显著提升。同时，其开源的特性，也方便开发者学习和改进。
DeepSWE对硬件的要求是什么？ 由于基于Qwen3-32B模型，DeepSWE的运行需要一定的硬件资源。具体要求取决于应用场景和模型使用方式。

阅读原文