当前位置:主页 > 头条快讯 > 财经 > 斯坦福抄袭国产大模型始末

斯坦福抄袭国产大模型始末

2024-06-05 00:30:01来源:新媒体

文章导读
“我们希望团队的好工作遭更多人关注与认可,但不是以这种方式。”6月3日,对于连日来备受关注的斯坦福大学AI团队疑似抄袭面壁智能一事,面壁智能CEO李大海作出回应。同一天,面壁智 ...

  “我们希望团队的好工作遭更多人关注与认可,但不是以这种方式。”6月3日,对于连日来备受关注的斯坦福大学AI团队疑似抄袭面壁智能一事,面壁智能CEO李大海作出回应。同一天,面壁智能联合创始人刘知远也发文回应提到,开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。

  风波中心的Llama3-V多模态大模型出自于斯坦福大学的一个本科生团队。几天前,该团队发布这一模型,并宣称只需500美元训练,其性能就比GPT-4V、Gemini Ultra、Claude Opus更强,一度成为“HuggingFace Trending”Top5。但随后,该模型遭指抄袭面壁智能发布的MiniCPMLlama3-V 2.5,且声浪越来越大。

  面壁智能是一家“清华系”人工智能大模型创业公司,成立于2022年8月,今年4月刚刚宣布完成新一轮数亿元融资。面壁智能自研了百亿参数预训练语言大模型CPM,MiniCPM是其端侧模型,也遭称为“小钢炮”。

  今年5月20日,面壁智能推出并开源MiniCPM系列最新的端侧多模态模型MiniCPM-Llama3-V 2.5,支持30+种语言,可实现最强端侧多模态综合性能。

  对于Llama3-V套壳、抄袭MiniCPM-Llama3-V 2.5的指责,主要聚焦在Llama3-V的模型结构和配置文件与MiniCPM-Llama3-V 2.5完全相同,只是进行了一些重新格式化并将部分变量重新命名,Llama3-V具有与MiniCPM-Llama3—V 2.5相同的分词器,包括MiniCPM-Llama3-V 2.5新定义的特殊符号等方面。

  Llama-3V团队曾回应,他们只是使用MiniCPM-Llama3-V 2.5的分词器,并在MiniCPM-Llama3-V2.5发布前就开始了这项工作,但并未解释如何做到在MiniCPMLlama3-V 2.5发布之前就获取详细分词器的究竟方式。

  随着事件引发的关注度越来越高,李大海与刘知远先后作出回应,其中最为关键且特别的证据,在于“清华简”。李大海称,经过团队核实,除了社区网友列出的证据外,面壁智能还发现,元宇宙之家消息,Llama-3V展现出和小钢炮一样的清华简识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。此外,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。

  刘知远提到,比较确信Llama-3V是对MiniCPM-Llama3-V 2.5的套壳,“证据是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋,就是对清华简的识别能力,这是我们从清华简逐字扫描并标注的数据集,并未公开。而Llama-3V展现出了一模一样的清华简识别能力,连做错的样例都一样”。

  目前,Llama3-V团队的两位作者已在社交平台上就这一学术不端行为向面壁智能MiniCPM团队正式道歉,并将问题归咎于另一名“无法联系”上的成员,同时表示会将Llama3-V模型悉数撤下。斯坦福人工智能实验室主任ChristopherDavid Manning也发文谴责这一抄袭行为,并对MiniCPM这一中国开源模型表示赞扬。

  值得一提的是,Llama3-V抄袭风波引发广泛关注的另一面,也在于大模型领域开源、套壳、抄袭由来已久的争议。在接受北京商报记者采访时,香颂资本董事沈萌称,开源就是把源代码公开,公开时都会选择一个遵循的协议,不同协议需遵循不同的规范。套壳还是抄袭的界定,都取决于开源的协议以及对方采取了怎样的动作。

  对于后续安排等问题,北京商报记者联系了面壁智能,但截至发稿未收到回复。

热门文章
日榜 周榜
1 怎么吸引老人投资 有效方法用起来

现时代,老年人口数量逐年增加,对于创业者而言,这无疑是一个巨大的商机,但是吸引老人...

2 怎么选择合适的草根投资项目 草根投资风险怎么规避

投资是现时代离不开的话题,投资可以抵御通货膨胀,投资可以实现资产增值,虽然市面投资...

3 个人借款需要哪些手续 需要借款的看过来

现时代,借款的需求很多人都有的,家庭开支、小孩上学费用或者创业等等,因为种种原因而...

4 网上投资有哪些风险 以下风险要注意

投资是为了实现个人的财富自由和收益自由,而投资可以线下投资或者网上投资,后者方式就...

5 中行信用卡下卡要多久到账 常见的下卡时间如下

信用卡是一种非常便捷和灵活的支付工具,方便了大家日常的各种购物,而各大银行都提供信...

6 刚刚!国家大基金三期来了,注册资本3440亿元,六大行也参与出

(原标题:刚刚!国家大基金三期来了,注册资本3440亿元,六大行也参与出资) 国家队出手!...

7 创纪录式上涨!港股难道已反转?

嘉宾介绍:胡超,CFA、FRM,拥有 证券 从业资格、基金从业资格以及期货从业资格,国家二级口...

8 “20cm”跌停!这些个股集体重挫 什么原因?

多家收到2023年年报问询函的A股上市公司,今天上午股价集体重挫,多股盘中甚至“20cm”跌停...

9 A股新概念!20CM闪电涨停 产业链有哪些机会?

今天上午,市场又现“跷跷板”效应。昨天领涨的TMT板块回调,其余几个近期活跃主线上涨,...

10 一夜之间9家A股公司收年报问询函!多家系“问询专业户”

“年报问询函”最近令上市公司提心吊胆。6月3日,前期收到年报问询函的多家上市公司股价大...

1 怎么吸引老人投资 有效方法用起来

现时代,老年人口数量逐年增加,对于创业者而言,这无疑是一个巨大的商机,但是吸引老人...

2 怎么选择合适的草根投资项目 草根投资风险怎么规避

投资是现时代离不开的话题,投资可以抵御通货膨胀,投资可以实现资产增值,虽然市面投资...

3 个人借款需要哪些手续 需要借款的看过来

现时代,借款的需求很多人都有的,家庭开支、小孩上学费用或者创业等等,因为种种原因而...

4 网上投资有哪些风险 以下风险要注意

投资是为了实现个人的财富自由和收益自由,而投资可以线下投资或者网上投资,后者方式就...

5 中行信用卡下卡要多久到账 常见的下卡时间如下

信用卡是一种非常便捷和灵活的支付工具,方便了大家日常的各种购物,而各大银行都提供信...

6 刚刚!国家大基金三期来了,注册资本3440亿元,六大行也参与出

(原标题:刚刚!国家大基金三期来了,注册资本3440亿元,六大行也参与出资) 国家队出手!...

7 创纪录式上涨!港股难道已反转?

嘉宾介绍:胡超,CFA、FRM,拥有 证券 从业资格、基金从业资格以及期货从业资格,国家二级口...

8 “20cm”跌停!这些个股集体重挫 什么原因?

多家收到2023年年报问询函的A股上市公司,今天上午股价集体重挫,多股盘中甚至“20cm”跌停...

9 A股新概念!20CM闪电涨停 产业链有哪些机会?

今天上午,市场又现“跷跷板”效应。昨天领涨的TMT板块回调,其余几个近期活跃主线上涨,...

10 一夜之间9家A股公司收年报问询函!多家系“问询专业户”

“年报问询函”最近令上市公司提心吊胆。6月3日,前期收到年报问询函的多家上市公司股价大...

撤稿申请|

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 metaversezj.com.cn 元宇宙之家 版权所有