自DeepSeek-V3.1正式发布,并在微信公众号上放出“UE8M0 FP8是针对即将发布的下一代国产芯片设计”信息后,引发了国内AI芯片概念股的连续上涨。东芯股份在这一轮热潮中也斩获颇丰,其东芯股份DRAM+砺算GPU的“存算联”一体化布局受到市场的广泛关注。
近日,东芯股份发布半年报,同时发布了《关于2025年度“提质增效重回报”行动方案的半年度评估报告》,表示砺算科技的7G100系列基于自研TrueGPU天图架构,从指令集到计算核心完全由自主设计。目前7G100系列已支持FP32、FP16、INT8等计算任务。但对FP8的支持,或许将是东芯股份下一步的着力方向。
布局“存算联”协同,盈利尚需努力
以存储芯片为核心布局“存算联”一体化,是外部对东芯股份发展战略的主要认知。东芯股份的主营业务围绕利基型存储芯片设计领域,是目前中国大陆为数不多能同时提供NAND Flash、NOR Flash、DRAM等存储芯片完整解决方案的公司之一,产品主要应用于网络通信、监控安防、消费类电子、工业与医疗、汽车电子等领域。
东芯股份还持有砺算科技37.88%的股份。砺算科技今年7月发布的自研GPU芯片“7G100”及显卡Lisuan eXtreme系列,支持智能多任务处理、乱序渲染等技术,实测在《黑神话:悟空》等大型游戏中表现优异,部分参数对标英伟达4060显卡。在AI领域,7G100则可应用于AI PC等领域,支持本地化AI模型。
砺算科技GPU需搭配DRAM存储器,而东芯股份的DRAM产品可通过协同设计优化性能。同时,在连接芯片领域,东芯股份正持续推进Wi-Fi 7无线通信芯片的研发设计工作。由此形成了东芯股份的“存算联”的一体化布局。
在发布半年报同日,东芯股份还发布了《关于2025年度“提质增效重回报”行动方案的半年度评估报告》,表示砺算科技的 7G100 系列作为一款全自研高性能图形 GPU,秉持创新融合,基于自研 TrueGPU 天图架构,从指令集到计算核心完全由自主设计。
因此,尽管东芯股份2025年半年报录得:主营收入3.43亿元,同比上升28.81%;归母净利润为-1.11亿元,同比下降21.78%;扣非净利润-1.27亿元,同比下降27.59%。东芯股份依然获得市场追逐。“国产GPU突破+存储周期反转”或是投资者对其认可的内在逻辑。
DeepSeek-V3.1发布,FP8计算成为新热点
国内当前AI芯片领域,随着DeepSeek-V3.1的发布,支持FP8 计算正在成为行业发展热点。在大模型的参数量呈指数级增长的背景下,其训练所需的计算资源和存储空间急剧攀升,采用低精度数值格式成为大模型继续扩容并降低训练成本的关键。FP8 是近年来 AI 领域新兴的浮点格式,其核心特点是存储结构通常采用1位符号位+ 3位指数位+ 4位尾数位(如 NVIDIA的FP8E5M2格式),或1位符号位+ 4位指数位+ 3位尾数位(如 FP8E4M3),数值范围和精度介于FP16与INT8之间;相比FP16,FP8可以节省50%显存带宽、降低75%功耗,同时保持较高的 AI 模型精度。英伟达GPU已开始支持 FP8,用于大模型推理。
FP8有多种表示方式,包括英伟达支持的E5M2、E4M3,以及UE8M0等。UE8M0 由 Open Compute Project(OCP)提出。OCP 是 2011 年由 Facebook(现 Meta)联合英特尔、Rackspace 等发起的开源硬件协作计划,成员包括微软、谷歌、亚马逊、AMD、英伟达、阿里、腾讯、百度等龙头企业。
E5M2、E4M3尽管被英伟达支持,成为国际主流格式,但其为英伟达GPU量身定制,在其他芯片上使用存在兼容问题。目前国产GPU支持FP8的还不多,如果此时都针对E4M3和E5M2进行优化,并不是一个最优解。DeepSeek-V3.1通过支持UE8M0设计可以寻找一条适合国产GPU的技术路线,将开启一条“软硬件协同”的适配路线。根据相关报道,国内厂商中,摩尔线程MTT S5000、燧原科技燧原L600等AI芯片产品已原生支持FP8低精度格式。根据招股书,沐曦股份在研的曦云C600也将支持FP8格式。
将在FP8方向发力?既是挑战也是机会
日前,东芯股份在互动平台表示,砺算科技致力于研发多层次(可扩展)图形渲染GPU芯片,产品可实现端、云、边的主流图形渲染和AI加速。其7G100系列GPU芯片可支持单精度浮点运算、半精度浮点运算、8位整数运算等计算任务。不同的计算精度根据其计算的性能、资源消耗及效率的不同,各有不同的适用场景。
单精度浮点(FP32)是浮点运算的“基础标准”,适合高精度科学计算与专业图形渲染;半精度浮点(FP16):平衡性能与功耗,适用于 AI 推理和部分图形任务;8 位整数(INT8):面向低精度、高吞吐量场景(如 AI 推理、轻量化模型运算),显著提升能效比。三种运算能力的支持,意味着该GPU能在“效率优先”和“精度优先”的场景间灵活切换,适配更多下游设备需求。
但根据现有公开信息,东芯股份目前尚未明确7G100系列GPU芯片支持FP8计算。7G100 系列主打中端市场,目标场景包括1080P/2K游戏、轻量级AI推理(如AIPC、云渲染)和专业图形设计。这些场景对精度需求集中在FP32(图形渲染)、FP16(AI 推理)和INT8(边缘计算)。这或许是东芯股份在上述方向取得突破的主要原因。
但从行业趋势上来看,东芯股份未来可能亦将在FP8的方向发力。当前主流 AI 框架,如TensorFlow、PyTorch对FP8的支持仍处于早期阶段,且需硬件厂商提供底层驱动和库优化。这对于构建产业生态的国产AI芯片厂商来说,既是挑战也是机会。