据外媒近日报道,人工智能公司DeepSeek因芯片问题推迟了其R2模型的发布。据悉,DeepSeek在训练R2模型时使用了华为的昇腾芯片,但由于昇腾平台的稳定性欠佳、软硬件支持不足以及芯片通信速度慢等问题,导致训练过程受阻。为此,DeepSeek不得不在训练阶段改用英伟达芯片,而在推理阶段继续使用华为芯片,这一调整使得R2模型的发布时间从原定的5月起被迫推迟。
为了解决这一问题,华为派遣了一个工程师团队前往DeepSeek的办公室,协助其使用昇腾芯片进行R2模型的开发。目前,DeepSeek仍在与华为合作,以确保推理阶段的兼容性。尽管如此,DeepSeek的创始人梁文锋对目前的进展表示不满,并决定加码研发投入,力争在几周内完成R2模型的发布。
此外,数据标注耗时超预期也是影响R2发布的重要因素之一。数据标注是人工智能模型训练中的关键环节,耗时过长无疑增加了项目整体的时间成本。
DeepSeek作为一家专注于人工智能领域的创新企业,其R2模型的发布备受业界关注。此次因芯片问题导致的推迟,不仅反映了当前芯片供应链的复杂性和技术挑战,也凸显了企业在技术研发过程中面临的诸多不确定性。
值得关注的是,中国监管层近月要求本土科技公司说明采购英伟达 H20 芯片的必要性,意在推动国产替代。但业内普遍认为,国产芯片在训练场景的成熟度、生态完整度仍落后英伟达一到两代。伯克利 AI 研究员 Ritwik Gupta 指出,“模型同质化趋势明显,开发者随时可以切换到阿里 Qwen3 等竞品”,这意味着留给 DeepSeek 的窗口期并不宽裕。