0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球首位AI程序员Devin诞生,超越GPT-4等业界巨头

微云疏影 来源:综合整理 作者:综合整理 2024-03-15 10:13 次阅读

2023年3月13日,全球首个人工智能程序员Devin正式亮相,自如适应新科技,自行修复瑕疵,甚至可自我调整及训练AI模型。其表现已超越GPT-4等明星产品

Devin来自 Cognition AI 公司,该公司位于纽约与旧金山,定位为集推理为本的应用型AI研究机构。Cognition AI之前一度低调。直至两个月前政府正式获批成立。

当前小组人数仅10人,却荣膺10块国际奥林匹克电脑竞赛(IOI)金牌。所有成员皆拥有丰富AI实践经验,背景包括Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro等领先企业。其中亦不乏华裔员工。

据悉,Devin的重大创新在于显著增强计算机逻辑和规划能力,同时具备全栈技能、自主学习新知识、构建部署应用程序、自动修复漏洞以及自我调整和训练AI模型等多种能力。

在 SWE-bench 的基准测试中,Devin能够准确无误地解决问题的比例高达13.86%;然而,GPT-4的这一数字仅为1.74%,并且还需依赖人类指示筛选和处理相关文件。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30072

    浏览量

    268337
  • 人工智能
    +关注

    关注

    1791

    文章

    46820

    浏览量

    237459
  • 应用程序
    +关注

    关注

    37

    文章

    3240

    浏览量

    57594
收藏 人收藏

    评论

    相关推荐

    AI编程工具会不会抢程序员饭碗

    AI编程工具可辅助编程,减少手动编码,提升效率,对程序员有积极影响也有挑战。程序员需深化技能、拓宽知识应对。长远看,AI与人类程序员将共生共
    的头像 发表于 11-08 10:17 104次阅读

    Llama 3 与 GPT-4 比较

    随着人工智能技术的飞速发展,我们见证了一代又一代的AI模型不断突破界限,为各行各业带来革命性的变化。在这场技术竞赛中,Llama 3和GPT-4作为两个备受瞩目的模型,它们代表了当前AI领域的最前
    的头像 发表于 10-27 14:17 264次阅读

    科大讯飞发布讯飞星火4.0 Turbo:七大能力超GPT-4 Turbo

    超过GPT-4 Turbo,数学能力和代码能力更是超过了Open AI最新一代GPT模型GPT-4o。此外,其效率相对提升50%。
    的头像 发表于 10-24 11:39 364次阅读

    OpenAI推出新模型CriticGPT,用GPT-4自我纠错

    基于GPT-4的模型——CriticGPT,这款模型专为捕获ChatGPT代码输出中的错误而设计,其独特的作用在于,让人们能够用GPT-4来查找GPT-4的错误。
    的头像 发表于 06-29 09:55 516次阅读

    阿里云发布通义千问2.5大模型,多项能力超越GPT-4

    阿里云隆重推出了通义千问 2.5 版,宣称其“技术进步,全面超越GPT-4”,尤其是在中文环境中的多种任务(如文本理解、文本生成、知识问答及生活建议、临时聊天及对话以及安全风险评估)方面表现出色,超越
    的头像 发表于 05-09 14:17 915次阅读

    微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓越的GPT-4 Turbo模型,这无疑将使得
    的头像 发表于 03-13 13:42 673次阅读

    新火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

    GPT-4被拉下神坛, Claude 3很可能对GPT-4实现全方位的碾压 。 Anthropic发布3个模型,全方位实现
    的头像 发表于 03-06 22:22 591次阅读
    新火种<b class='flag-5'>AI</b>|秒杀<b class='flag-5'>GPT-4</b>,狙杀<b class='flag-5'>GPT</b>-5,横空出世的Claude 3振奋人心!

    全球最强大模型易主,GPT-4超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude 3系列在推理、数学、编码、多语言理解和视觉方面全面超越了包括GPT-4在内的所
    的头像 发表于 03-05 09:58 617次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力关键领域展现出卓越性能,成功击败了此前被广泛认为是全球最强AI模型的
    的头像 发表于 03-05 09:49 634次阅读

    全球最强大模型易主:GPT-4超越,Claude 3系列崭露头角

    近日,人工智能领域迎来了一场革命性的突破。Anthropic公司发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力关键指标上展现出卓越性能,成功超越了此前被广泛认为是全球最强
    的头像 发表于 03-05 09:42 605次阅读

    ChatGPT plus有什么功能?OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能

    OpenAI 发布 GPT-4 Turbo 目前我们所知道的功能分析解答 在最近的OpenAI DevDay上,该组织发布了一项备受期待的公告:推出GPT-4 Turbo,这是对其突破性AI模型
    的头像 发表于 12-13 09:19 1059次阅读
    ChatGPT plus有什么功能?OpenAI 发布 <b class='flag-5'>GPT-4</b> Turbo 目前我们所知道的功能

    诚邀报名 | GPT驱动的新程序员时代,开发者如何编程?

    模式,开发者们迎来了编程范式的全新变革。传统的编程不再局限于编写线性代码和优化逻辑,自然语言取而代之,成为了编程的新工具,这大大降低了开发的门槛。 如今,以ChatGPT、Copilot为代表的AI工具,将全球的知识库和代码库
    的头像 发表于 12-11 22:20 512次阅读

    AI观察 | 今年最火的GPT-4,正在缔造科幻版妙手仁心!

    近来,微软对于提示工程能力的最新研究 1 (链接详见文末)再次吸引了一众媒体的目光:“无需额外微调、无需专业策划,仅凭提示GPT-4就能化身专家!”报道中这样描述道 2 。 基于最新提示策略
    的头像 发表于 12-11 08:15 458次阅读
    <b class='flag-5'>AI</b>观察 | 今年最火的<b class='flag-5'>GPT-4</b>,正在缔造科幻版妙手仁心!

    新火种AI|谷歌深夜发布复仇神器Gemini,原生多模态碾压GPT-4

    谷歌背水一战,发布Gemini,狙击GPT-4
    的头像 发表于 12-08 09:09 1094次阅读
    新火种<b class='flag-5'>AI</b>|谷歌深夜发布复仇神器Gemini,原生多模态碾压<b class='flag-5'>GPT-4</b>?

    OpenAI发布的GPT-4 Turbo版本ChatGPT plus有什么功能?

    OpenAI的GPT-4 Turbo以前所未有的功能和价格改变人工智能的未来 在人工智能领域的一次里程碑式活动中,OpenAI开发者大会上发布了GPT-4 Turbo,这是突破性人工智能模型
    的头像 发表于 12-05 17:57 2386次阅读
    OpenAI发布的<b class='flag-5'>GPT-4</b> Turbo版本ChatGPT plus有什么功能?