华为盘古大模型风波:内部员工揭露研发过程中的套壳与续训问题

   时间:2025-07-06 20:52 来源:ITBEAR作者:顾青青

近日,科技圈内爆发了一场关于大型语言模型知识产权的争议。争议的核心是华为诺亚方舟实验室开发的盘古大模型(Pangu Pro MoE)被指控存在抄袭行为,指控方为GitHub上的@HonestAGI,其发布的研究论文指出盘古大模型涉嫌抄袭阿里巴巴的通义千问Qwen-2.5 14B模型。

面对这一指控,华为诺亚方舟实验室迅速作出回应,坚决否认抄袭,并解释称盘古Pro MoE开源模型的部分基础组件代码实现确实参考了其他开源大模型的代码,但这一切都是严格遵循开源许可证要求进行的。

然而,事态并未因此平息。网络上随后出现了一封疑似华为诺亚方舟实验室内部员工的公开信,信中详细披露了盘古大模型开发过程中的诸多不为人知的细节,并自曝了团队内部存在的一系列问题。

据这位内部员工透露,盘古大模型在开发过程中经历了诸多波折,包括算力有限、模型效果不理想、内部质疑声不断等。在面临巨大压力的情况下,团队做出了一些“非常规”操作,如套壳、续训、洗水印等,以求在短时间内提升模型效果。

这位员工表示,自己曾是盘古大模型团队的一员,对华为有着深厚的感情。然而,这些“非常规”操作让他深感失望和羞愧,认为这些行为将成为自己职业生涯中无法抹去的污点。因此,他决定站出来揭露真相,并申请从盘古部分技术报告的作者名单中移除。

信中,他还详细描述了华为诺亚方舟实验室的内部组织架构和工作流程,以及盘古大模型从最初的设计到后续的开发过程。他提到,盘古大模型早期内部代号叫做“盘古智子”,团队在昇腾卡上进行了大量的训练工作,付出了巨大的心血和代价。

然而,由于种种原因,盘古大模型在开发过程中遇到了诸多困难。例如,71B和135B模型在更换tokenizer时遇到了失败,导致模型效果不理想。在面临内部质疑和领导压力的情况下,团队做出了套壳和续训的决定。

这位员工还透露,王云鹤及其小模型实验室在盘古大模型的开发过程中扮演了重要角色,但他们的做法往往缺乏透明度,甚至存在直接套壳其他模型的情况。这些行为不仅损害了团队的利益,也让认真做事的同事们感到心寒和失望。

信中最后,这位员工以生命、人格和荣誉发誓,所写内容均为真实。他表示,自己不怕被公司追责或威胁,只希望能为真相发声,为那些默默付出的同事们讨回公道。

这封公开信的出现,无疑为这场争议增添了更多的火药味。目前,华为方面尚未对此公开信作出正式回应。但这场争议已经引起了业界的广泛关注,也让人们对大型语言模型的知识产权问题产生了更多的思考。

 
 
更多>同类内容
全站最新
热门内容