GPT-5难产内幕曝光!核心团队遭挖空、与微软分歧、靠英伟达续命?

来源:钜亨网 #人工智能#
2475

根据外媒《The Information》近日揭露,人工智能(AI)领头企业OpenAI 的最新模型GPT-5 在研发过程中屡遇阻碍,不仅未能实现重大技术突破,还因关键人才流失与内部协调不善,引发组织混乱,导致开发进度受挫。

根据《The Information》,相较于GPT-3 到GPT-4 带来的技术飞跃,GPT-5 的表现属于「渐进式」,并未实现外界期待中的革命性突破。虽然在程式设计、数学推理及AI 代理应用方面有所提升,但尚不足以称为「下一代颠覆者」。

内部消息指出,某实验性新模型在内部测试阶段表现出色,但当转化为对话形式的「o3」版本后,推理能力显著下降,暴露出OpenAI 在模型转化与推理能力上仍面临架构性瓶颈。

Orion 计划失败,GPT-4.5 低调接棒

回顾GPT-5 的开发历程,OpenAI 最初曾寄望名为「Orion」的模型作为旗舰发布。

但实际测试中,Orion 效能不如预期,最终被降级为GPT-4.5,并于2025 年2 月低调上线。该模型虽短暂现身,但迅速淡出公众视野。

导致Orion 失利的主要原因在于预训练资料瓶颈。随着高品质网路数据日益稀缺,许多过去对中小型模型有效的训练技巧,在大型语言模型上反而失去作用,使Orion 无法突破性能上限,也影响了GPT-5 的开发信心。

OpenAI 人才流失与内部摩擦加剧发展压力

除了技术挑战,OpenAI 也遭遇严重的人事风波。

报导指出,Meta( META-US ) 近期以高额薪资挖走大量核心人才,迫使OpenAI 紧急调整组织架构。

OpenAI 研究副总裁Jerry Tworek 更在公司Slack 上公开抱怨团队动荡,称需休假重新思考方向。虽最终未实际休假,但该讯息在内部广泛传播,显示内部管理已现压力。

另外,部分资深研究员对将研发成果交予微软( MSFT-US ) 持保留态度。虽然两家公司财务紧密,但在具体合作条款上,却始终争执不休。根据最新资讯,OpenAI 重组营利部门后,微软很可能在其中获得33% 的股份。

绝境中的转机:推理模型意外崛起

总的来说,直到2025 年6 月为止,OpenAI 在开发能称得上GPT-5 等级的AI 模型时,依然没有令人满意的成果。但就在此时,推理模型成为突破技术瓶颈的全新转机。

早在2023 年底,一项名为「Q*」的技术实验性成果,引起OpenAI 内部广泛关注。该技术首次显示出可处理前所未见的数学难题,为语言模型打开了推理能力的全新大门。

基于Q*,OpenAI 快速部署了数款具备推理能力的模型,并发现这些模型在取得更多算力支援后,性能会大幅提升,显示出突破预训练效能瓶颈的潜力。

2024 年秋天,第一代推理模型「o1」问世。同年年底,OpenAI 再推出进阶版本「o3」,其基于GPT-4o 打造的架构,在理解复杂知识领域方面表现明显优于前代。

据内部透露,这一进步主要得益于两项技术提升:

使用更多英伟达芯片提升训练教师模型的能力;

开放模型对网路搜索与程式码库的存取权限,强化知识获取与实作能力。

此外,OpenAI 也在o3 训练中导入了强化学习技术。研究人员设计出一系列来自生物学、医学与软体工程等专业领域的难题,让模型生成数千个可能的解答,再从中挑选与人类专家结果一致的「合成资料」,用于反馈训练。

这种数据生成与挑选方法,被视为下一阶段语言模型提升的重要策略。

GPT-5 未如愿突破,高层押注GPT-8 与AGI 愿景

虽然GPT-5 未能成为预期中的技术革命,但OpenAI 高层仍对未来的语言模型发展充满信心。有微软工程师表示,新一代模型能在相同算力下生成更高品质的程式码与文字,显示效率与能力双双提升。

OpenAI 执行长Sam Altman 则多次公开指出,现有技术架构仍具备实现通用人工智慧(AGI)的潜力。更有高层向投资人透露,公司有望一步步实现GPT-8 等级的模型,最终迈向AI 终极目标。

融资不减反增,OpenAI 估值突破3000 亿美元

尽管GPT-5 尚未完成,OpenAI 依然吸引了大批资本投入。 2025 年初,公司提前完成83 亿美元融资,使估值一举突破3000 亿美元。

该融资为全年400 亿募资计画的一部分,由Dragoneer 投资集团领投28 亿美元,红杉资本、Blackstone、TPG 等机构跟投。

虽然Dragoneer 为本轮最大出资方,但整体募资则由日本软银主导。

责编: 爱集微
来源:钜亨网 #人工智能#
THE END
关闭
加载

PDF 加载中...