Devin
内测中
AI编程工具

Devin

首个全自主的AI软件工程师智能体

标签:
笔灵AI论文写作广告
笔灵AI广告

Devin是什么

Devin是由人工智能初创公司Cognition推出的全球首个全自主的AI软件工程师智能体,具备强大的编程和软件开发能力,能够在多个方面协助或完全独立地完成软件开发任务。在SWE-bench基准测试中,Devin解决实际问题的表现远超如GPT-4和Claude 2等AI模型。

Devin AI

Devin的开发公司Cognition正式成立虽然仅两个月,但团队成员拥有丰富的AI前沿工作经验,并且拥有多枚国际信息学奥林匹克竞赛(IOI)金牌,已获彼得·蒂尔的Founders Fund基金领投的2100万美元A轮融资。

Devin的主要功能

  • 自主学习新技术:Devin能够通过阅读文档和代码来学习它不熟悉的技术,从而扩展其技能集。
  • 端到端构建和部署程序:Devin 能够理解整个软件开发流程,从前端设计到后端部署,甚至包括将应用程序发布上线。这意味着它可以从零开始构建网站、游戏或其他软件项目,并处理相关的工作流程。
  • 自主查找并修复Bug:Devin 具有出色的调试能力,能够发现并修复代码中的错误,即使开发者自己都没有注意到的问题也能被它找到并解决。
  • 训练和微调AI模型:Devin 不仅能够处理常规的编程任务,还能帮助训练和微调其他AI模型,显示出在人工智能领域的深度应用能力。
  • 修复开源库:对于开源社区中的问题,Devin 能够理解和解决,例如修复已知的bug或实现新的特性请求。
  • 对成熟生产库做贡献:Devin 能够对已经成熟的生产库做出贡献,例如修复已知的错误或添加新功能。
Devin

Devin的性能对比

在SWE-bench基准测试中(要求智能体解决在 Django 和 scikit-learn 等开源项目中发现的实际 GitHub 问题),Devin能够正确处理13.86%的问题。这一成绩显著高于之前技术水平的1.96%,显示出Devin在理解和解决实际编程问题方面的巨大优势。

对比其他AI模型:Devin的表现远远超过了其他知名的AI模型,如GPT-4和Claude 2,这些模型在同样的测试中的正确率通常较低。

Devin SWE-bench基准测试

如何使用Devin

目前Devin还在内测中,请访问Coginition的官网查看更多信息,想要抢先体验的用户可填写Devin的内测申请表

©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

类似于Devin的工具

暂无评论

暂无评论...