华为盘古否认抄袭阿里后,其大模型员工自曝存在套壳、续训、洗水印_ZAKER新闻 华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE)
创始人
2025-07-07 14:31:49
0

2025 年 6 月 30 日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括 70 亿参数稠密模型和 720 亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。

然而仅隔四天,一项发布于 GitHub 的研究引发业界关注:用户 @HonestAGI 通过 "LLM 指纹 " 技术分析指出,盘古 Pro MoE 与阿里通义千问 Qwen-2.5 14B 模型的注意力参数分布相似性高达 0.927(1.0 为完全一致),远超业内 0.7 以下的正常差异范围。

华为诺亚方舟实验室声明截图

华为诺亚方舟实验室 7 月 5 日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。

盘古团队表示," 盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。"

然而,就在 7 月 6 日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。

爆料文章截图

该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。

自曝文中称:" 经过内部的分析,他们实际上是使用 Qwen 1.5 110B 续训而来,通过加层,扩增 ffn 维度,添加盘古 pi 论文的一些机制得来,凑够了大概 135B 的参数。" 并表示," 听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。"" 他们选择了套壳 DeepSeekv3 续训。他们通过冻住 DeepSeek 加载的参数,进行训练。"

最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。

截至目前,华为并未对此自曝内容发表声明。

来源:新 · 黄河客户端、新浪科技、诺亚方舟实验室、云头条

相关内容

热门资讯

一直加95号油可以换92号汽油... 答案是不可以。发动机的涡轮增压器需要使用95号以上的汽油,而自然吸气发动机可以使用92号以上的汽油。...
长城m4油箱多少升 长城m4油... 长城M4的油箱容量设计为45升,这一数据反映了油箱的储存能力,也是决定汽车行驶里程的重要因素之一。在...
按揭车改色到底要不要绿本 按揭... 按揭车改色时,是否需要绿本(机动车登记证书)是一个关键问题。绿本通常是车辆所有权的法定证明,对于贷款...
黑牌子的车是什么意思 黑牌子的... 黑牌子的车是指使用黑色牌照的车辆。黑色牌照是涉外车辆的标志,代表该车为外籍车或外交机构用车。车牌的颜...
联动云车内有摄像头吗? 鑱斿姩... 联动云车内并没有安装摄像头,但是车内配备了GPS定位系统。作为共享汽车,联动云提供了多样化的车型选择...
gs是什么车 gs是什么车 g... GS是别克品牌下的一款运动型轿车,即别克君威GS。这款车归属于上海通用汽车旗下,以其独特的设计和卓越...
异地过户车辆如何办 异地过户车... 异地车辆过户的流程如下:首先,将车开到过户验车处,工作人员会对车辆进行检查、拓号、拆牌和照相,需要缴...
面包车报废年限是多少年 面包车... 面包车的报废年限与其用途相关,不同用途的面包车有不同的报废期限。1. 用于出租客运的面包车,报废期限...
五菱荣光和五菱之光有什么区别 ... 五菱荣光和五菱之光是两款不同的车型,它们在体型、动力、油耗、功能、车身和配置等方面都存在一些区别。首...
开车开到对向车道怎么处罚 开车... 根据《道路交通安全违法行为记分分值》第三条规定,驾驶机动车不按规定超车、让行的,或者逆向行驶的,一次...