0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

斯坦福团队抄袭国产大模型,主要责任人失联

Felix分析 来源:电子发烧友 作者:吴子鹏 2024-06-05 00:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)近日,斯坦福大学AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5。该事件引起了业界的广泛关注,也让大家对于开源大模型的规范使用更加担忧。

斯坦福Llama3V模型被证实抄袭

5月29日,斯坦福大学的一个AI团队在Github等平台发布了一款大模型,名为Llama3V,该模型的亮点是据称只需要500美元就可以训练出一个 SOTA多模态模型,模型效果可比肩GPT-4V、Gemini Ultra等大模型。

由于模型团队来自斯坦福,且效果描述非常吸引眼球,因此该模型很快在社交平台发酵,推特上相关话题的浏览量超过了30万,迅速冲到了Hugging Face首页。

不过,有用户很快发现,Llama3-V大模型实际上是套壳面壁智能的MiniCPM-Llama3-V 2.5,但Llama3-V在发布信息中并没有体现这一点,且称只是使用了MiniCPM-Llama3-V 2.5的tokenizer。但这一说法让用户很难认同,随后有用户在Github页面上指出了套壳的问题,但相关言论很快被斯坦福团队删除。

该用户非常不满随后到MiniCPM-Llama3-V 2.5页面下重述了这一问题,并提醒面壁智能重视此事。面壁团队通过测试发现,Llama3V与MiniCPM-Llama3-V 2.5在“胎记”般案例上的表现100%雷同,做实了斯坦福团队的抄袭行为。随后,这一事件在国外媒体迅速发酵。

随后不久,斯坦福Llama3-V团队承认抄袭,斯坦福本科生Siddharth Sharma和Aksh Garg发布了道歉声明,不过据称是主要责任人的Mustafa Aljadery并没有出现在道歉声明中,这名学生来自南加利福尼亚大学,目前处于失踪的状态,是这一事件的主要过错方。

Aksh Garg在道歉声明中表示,“首先,我们要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa一起发布了Llama3-V,Mustafa为这个项目编写了代码,但从昨天起就无法联系他。我与Siddharth Sharma主要负责帮助Mustafa进行模型推广。我们俩查看了最新的论文,以验证这项工作的新颖性,但并未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”

6月3日,面壁智能CEO李大海与联合创始人刘知远先后发文,回应开源模型被斯坦福大学AI团队抄袭一事。李大海表示:“我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”“我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

据介绍,MiniCPM-Llama3-V 2.5是MiniCPM-V系列的最新版本模型,基于SigLip-400M和Llama3-8B-Instruct构建,共参数规模为8B,相较于MiniCPM-V 2.0性能取得较大幅度提升。MiniCPM-Llama3-V 2.5在综合了11个主流多模态大模型评测基准的OpenCompass榜单上平均得分65.1的成绩,超越了GPT-4o、GPT-4V、Gemini Pro、Qwen-VL-Max等商用闭源模型。

开源大模型规范使用值得关注

开源大模型是指一种基于开源技术和大规模数据集构建的人工智能模型,具有开放性和可扩展性的特点。开源大模型与传统的商业人工智能模型不同,其最大的特点在于开放性和可扩展性。这种模型的构建需要利用大量的开源工具和资源,包括开源的深度学习框架、开源的数据集和开源的算法等。

开源大模型是AI大模型发展的重要分支,拥有LLaMA、Grok-1、Stable Code Instruct-3B、Mistral 8x7B和零一万物的Yi-34B等代表产品,这些大模型的发布和发展,不仅显著增强了数据的安全性和隐私保护,更为用户节省了大量成本,减少了对外部依赖的需求。

不过,由于是开源的,因此开源大模型一直以来都面临着被抄袭的风险。实际上,上述提到的零一万物的Yi-34B在去年也是深陷抄袭的漩涡里。2023年11月14日,一位国外开发者在Hugging Face开源主页上评论称,创新工场董事长兼CEO、零一万物CEO李开复旗下 AI 公司“零一万物”开源大模型Yi-34B,完全使用Meta研发的LIama开源模型架构,而只对两个张量(Tensor)名称进行修改。

根据零一万物的说明,零一万物在训练模型过程中,沿用了GPT/LLaMA的基本架构,由于LLaMA社区的开源贡献,让零一万物可以快速起步。零一万物还在声明中称,模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的AI infra能力等。

实际上,在更早的2022年,智源研究院的大模型研究中心就被爆出了抄袭的问题,一篇拥有100位作者署名的综述研究《A Roadmap for Big Model》被质疑抄袭了多篇论文内容,引发国内外学者和社区的广泛关注与讨论。另外,商汤、谷歌等公司都曾被指出存在抄袭问题。

目前,AI大模型在防止抄袭、版权归属等问题方面还存在很大的漏洞,行业法规明显不健全,关于大模型使用已有作品进行训练是否构成侵权,以及大模型生成物是否可以享有版权,这类事件也已经有案件发生。相信随着行业的进一步发展,杜绝抄袭和版权归属将逐渐有法可依,这样会更有利于大模型的发展。

结语

斯坦福团队开源大模型抄袭事件暴露了开源大模型的滥用和监管问题,同时AI大模型也还有更深层次的数据和作品版权归属问题,因此不难看出AI大模型尚处于野蛮生长的阶段,未来还需要逐步健全行业法规。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    3857

    浏览量

    5289
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    斯坦福SR830锁相放大器参考频率设置方法详解

    斯坦福研究系统(Stanford Research Systems)生产的SR830数字双相锁相放大器,以其高精度、高稳定性和强大的信号处理能力,广泛应用于物理、材料科学、化学及精密测量等领域。其
    的头像 发表于 04-27 15:35 171次阅读
    <b class='flag-5'>斯坦福</b>SR830锁相放大器参考频率设置方法详解

    如何校准斯坦福锁相放大器的增益

    锁相放大器(Lock-in Amplifier)是一种用于提取微弱信号、抑制噪声的高精度测量仪器,广泛应用于物理、化学、生物及材料科学等领域。斯坦福研究系统(Stanford Research
    的头像 发表于 04-08 15:48 148次阅读
    如何校准<b class='flag-5'>斯坦福</b>锁相放大器的增益

    斯坦福锁相放大器SR830参考频率设置方法详解

    斯坦福研究系统(Stanford Research Systems)生产的SR830锁相放大器是一款高性能、高精度的信号检测仪器,广泛应用于物理、化学、材料科学及精密测量等领域。其核心功能是通过
    的头像 发表于 03-30 17:02 479次阅读
    <b class='flag-5'>斯坦福</b>锁相放大器SR830参考频率设置方法详解

    云知声CEO黄伟博士做客斯坦福“与AI同行”系列讲座

    近日,斯坦福成长创新圈联合斯坦福上海校友会举办的斯坦福“与AI同行”系列讲座马年首场线上活动圆满落幕,云知声CEO黄伟博士作为特邀嘉宾,结合近30年AI领域深耕经验与云知声十余载创业实践,深度复盘了中国AI产业从1.0到2.0的
    的头像 发表于 03-13 15:46 542次阅读

    斯坦福锁相放大器相位的正确设置方法

    在精密物理测量与微弱信号检测领域,斯坦福锁相放大器因其高灵敏度与强抗噪能力被广泛应用。其中,相位的正确设置是确保测量精度的关键环节。若参考信号与被测信号之间存在相位差,将直接影响输出信号的幅值与相位
    的头像 发表于 03-10 16:37 775次阅读
    <b class='flag-5'>斯坦福</b>锁相放大器相位的正确设置方法

    斯坦福锁相放大器与塞恩锁相放大器的选型对比分析

    在精密测量与科研实验中,锁相放大器作为提取微弱信号的核心仪器,其性能直接决定实验数据的准确性与可靠性。斯坦福(Stanford Research Systems)与塞恩(Sine, 或指代国产高精度
    的头像 发表于 02-04 16:38 650次阅读
    <b class='flag-5'>斯坦福</b>锁相放大器与塞恩锁相放大器的选型对比分析

    斯坦福锁相放大器SR830与SR860的主要区别分析

    锁相放大器(Lock-in Amplifier)是精密测量领域中不可或缺的核心仪器,广泛应用于物理、化学、生物及材料科学等研究方向,用于从强噪声背景中提取微弱信号。斯坦福研究系统公司
    的头像 发表于 01-22 15:57 460次阅读
    <b class='flag-5'>斯坦福</b>锁相放大器SR830与SR860的<b class='flag-5'>主要</b>区别分析

    IBM Granite登顶斯坦福大学2025年基础模型透明度指数报告

    IBM Granite 模型系列在斯坦福大学发布的 2025年“基础模型透明度指数”(Stanford Foundation Model Transparency Index)名列第一,并创下该指数的历史最高分。
    的头像 发表于 12-24 11:20 922次阅读
    IBM Granite登顶<b class='flag-5'>斯坦福</b>大学2025年基础<b class='flag-5'>模型</b>透明度指数报告

    斯坦福团队开发新型铁基电池材料推动储能技术发展

    这项关于铁基电池材料的发现最直接的应用前景在于锂离子电池领域。研究人员采用锂、铁、锑和氧合成的正极材料,在斯坦福大学与SLAC国家加速器实验室联合建立的电池中心进行的初步测试中表现出稳定的高电压特性
    的头像 发表于 11-13 14:41 622次阅读
    <b class='flag-5'>斯坦福</b><b class='flag-5'>团队</b>开发新型铁基电池材料推动储能技术发展

    回收出售租赁维修二手斯坦福SR620频率计

    回收出售租赁维修二手斯坦福SR620频率计 SR620时间间隔和频率计数器概述 SR620是一款高精度时间间隔和频率计数器,适用于实验室或ATE环境中的各类时间和频率测量需求。其核心优势在于单次
    发表于 08-25 14:22

    斯坦福(Stanford)锁相放大器故障修复

    斯坦福锁相放大器是由斯坦福研究系统公司(Stanford Research Systems, SRS)研发的一款测量工具,主要用于微弱信号的测量和提取。它结合了高灵敏度、高精度、高稳定性和多功能性于一体,是科研和工业领域的重要设
    的头像 发表于 07-30 10:58 1096次阅读
    <b class='flag-5'>斯坦福</b>(Stanford)锁相放大器故障修复

    斯坦福SR530锁相放大器技术手册

    斯坦福SR530锁相放大器是一款专为精密微弱信号检测设计的高性能仪器,核心功能是从强噪声背景中提取特定频率信号,广泛应用于物理、化学、生物医学及工程领域。
    的头像 发表于 07-11 18:02 1092次阅读
    <b class='flag-5'>斯坦福</b>SR530锁相放大器技术手册

    斯坦福SR445A科研级前置放大器安装、操作与维护指南

    斯坦福前置放大器SR445A是一款专为低噪声信号放大设计的高性能设备,覆盖直流至高频段,提供可变增益及灵活的滤波功能,适用于光电探测、生物电信号、精密测量等领域。
    的头像 发表于 06-20 16:52 1782次阅读
    <b class='flag-5'>斯坦福</b>SR445A科研级前置放大器安装、操作与维护指南

    斯坦福SR830锁相放大器低量程报错维修步骤详解

    近期某客户送修一台斯坦福SR830锁相放大器,报修故障为在低量程状态下一直报错 OVLD。对仪器进行初步检测,仪器缺旋钮盖;开机自检正常;GPIB正常;空载SENSITIVTY 在2mV以下报
    的头像 发表于 06-10 18:06 1145次阅读
    <b class='flag-5'>斯坦福</b>SR830锁相放大器低量程报错维修步骤详解

    斯坦福DG535脉冲发生器无法启动故障诊断与维修方案

    近期深圳某院校送修一台斯坦福DG535数字延时脉冲发生器,报修故障为开机之后面板卡住,操作没有反应。对仪器进行初步检测,仪器开机之后卡在启动界面,指示灯全亮,按键没有反应。
    的头像 发表于 05-28 16:02 790次阅读
    <b class='flag-5'>斯坦福</b>DG535脉冲发生器无法启动故障诊断与维修方案