摘要:Junie使用了广受好评的SWE-BenchVerified基准,其中包含500项常见开发任务,它能在一次运行中解决53.6%的任务,其中Weights&Biases“ProgrammerO1crosscheck5”目前以64.6%的得分遥遥领先。JetBra
据techcrunch网1月24日报道,编码工具公司JetBrains于本周四推出了一款新的人工智能编码代理Junie。
Junie使用了广受好评的SWE-BenchVerified基准,其中包含500项常见开发任务,它能在一次运行中解决53.6%的任务,其中Weights&Biases“ProgrammerO1crosscheck5”目前以64.6%的得分遥遥领先。JetBrains公司称Junie的得分“很有希望”。JetBrains的IDE服务仍有优势,它与JetBrains集成开发环境的其他部分紧密集成。
该公司指出,即使Junie能帮助开发人员完成工作,但人类始终处于控制地位,即使将任务委托给代理也是如此。人工智能生成的代码可能与开发人员编写的代码一样存在缺陷。最终,Junie不仅能加快开发速度,还能提高代码质量标准。通过将JetBrains集成开发环境的强大功能与LLM相结合,Junie可以生成代码、运行检查、编写测试并验证它们是否通过。
(编译:墨书)
来源:邮电设计技术
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!