FP8：或将是东芯股份的下一步着力方向

作者：陈炳欣 15小时前

来源：爱集微 #东芯股份# #AI芯片# #FP8#

1853

自DeepSeek-V3.1正式发布，并在微信公众号上放出“UE8M0 FP8是针对即将发布的下一代国产芯片设计”信息后，引发了国内AI芯片概念股的连续上涨。东芯股份在这一轮热潮中也斩获颇丰，其东芯股份DRAM+砺算GPU的“存算联”一体化布局受到市场的广泛关注。

近日，东芯股份发布半年报，同时发布了《关于2025年度“提质增效重回报”行动方案的半年度评估报告》，表示砺算科技的7G100系列基于自研TrueGPU天图架构，从指令集到计算核心完全由自主设计。目前7G100系列已支持FP32、FP16、INT8等计算任务。但对FP8的支持，或许将是东芯股份下一步的着力方向。

布局“存算联”协同，盈利尚需努力

以存储芯片为核心布局“存算联”一体化，是外部对东芯股份发展战略的主要认知。东芯股份的主营业务围绕利基型存储芯片设计领域，是目前中国大陆为数不多能同时提供NAND Flash、NOR Flash、DRAM等存储芯片完整解决方案的公司之一，产品主要应用于网络通信、监控安防、消费类电子、工业与医疗、汽车电子等领域。

东芯股份还持有砺算科技37.88%的股份。砺算科技今年7月发布的自研GPU芯片“7G100”及显卡Lisuan eXtreme系列，支持智能多任务处理、乱序渲染等技术，实测在《黑神话：悟空》等大型游戏中表现优异，部分参数对标英伟达4060显卡。在AI领域，7G100则可应用于AI PC等领域，支持本地化AI模型。

砺算科技GPU需搭配DRAM存储器，而东芯股份的DRAM产品可通过协同设计优化性能。同时，在连接芯片领域，东芯股份正持续推进Wi-Fi 7无线通信芯片的研发设计工作。由此形成了东芯股份的“存算联”的一体化布局。

在发布半年报同日，东芯股份还发布了《关于2025年度“提质增效重回报”行动方案的半年度评估报告》，表示砺算科技的 7G100 系列作为一款全自研高性能图形 GPU，秉持创新融合，基于自研 TrueGPU 天图架构，从指令集到计算核心完全由自主设计。

因此，尽管东芯股份2025年半年报录得：主营收入3.43亿元，同比上升28.81%；归母净利润为-1.11亿元，同比下降21.78%；扣非净利润-1.27亿元，同比下降27.59%。东芯股份依然获得市场追逐。“国产GPU突破+存储周期反转”或是投资者对其认可的内在逻辑。

DeepSeek-V3.1发布，FP8计算成为新热点

国内当前AI芯片领域，随着DeepSeek-V3.1的发布，支持FP8 计算正在成为行业发展热点。在大模型的参数量呈指数级增长的背景下，其训练所需的计算资源和存储空间急剧攀升，采用低精度数值格式成为大模型继续扩容并降低训练成本的关键。FP8 是近年来 AI 领域新兴的浮点格式，其核心特点是存储结构通常采用1位符号位+ 3位指数位+ 4位尾数位（如 NVIDIA的FP8E5M2格式），或1位符号位+ 4位指数位+ 3位尾数位（如 FP8E4M3），数值范围和精度介于FP16与INT8之间；相比FP16，FP8可以节省50%显存带宽、降低75%功耗，同时保持较高的 AI 模型精度。英伟达GPU已开始支持 FP8，用于大模型推理。

FP8有多种表示方式，包括英伟达支持的E5M2、E4M3，以及UE8M0等。UE8M0 由 Open Compute Project（OCP）提出。OCP 是 2011 年由 Facebook（现 Meta）联合英特尔、Rackspace 等发起的开源硬件协作计划，成员包括微软、谷歌、亚马逊、AMD、英伟达、阿里、腾讯、百度等龙头企业。

E5M2、E4M3尽管被英伟达支持，成为国际主流格式，但其为英伟达GPU量身定制，在其他芯片上使用存在兼容问题。目前国产GPU支持FP8的还不多，如果此时都针对E4M3和E5M2进行优化，并不是一个最优解。DeepSeek-V3.1通过支持UE8M0设计可以寻找一条适合国产GPU的技术路线，将开启一条“软硬件协同”的适配路线。根据相关报道，国内厂商中，摩尔线程MTT S5000、燧原科技燧原L600等AI芯片产品已原生支持FP8低精度格式。根据招股书，沐曦股份在研的曦云C600也将支持FP8格式。

将在FP8方向发力？既是挑战也是机会

日前，东芯股份在互动平台表示，砺算科技致力于研发多层次（可扩展）图形渲染GPU芯片，产品可实现端、云、边的主流图形渲染和AI加速。其7G100系列GPU芯片可支持单精度浮点运算、半精度浮点运算、8位整数运算等计算任务。不同的计算精度根据其计算的性能、资源消耗及效率的不同，各有不同的适用场景。

单精度浮点（FP32）是浮点运算的“基础标准”，适合高精度科学计算与专业图形渲染；半精度浮点（FP16）：平衡性能与功耗，适用于 AI 推理和部分图形任务；8 位整数（INT8）：面向低精度、高吞吐量场景（如 AI 推理、轻量化模型运算），显著提升能效比。三种运算能力的支持，意味着该GPU能在“效率优先”和“精度优先”的场景间灵活切换，适配更多下游设备需求。

但根据现有公开信息，东芯股份目前尚未明确7G100系列GPU芯片支持FP8计算。7G100 系列主打中端市场，目标场景包括1080P/2K游戏、轻量级AI推理（如AIPC、云渲染）和专业图形设计。这些场景对精度需求集中在FP32（图形渲染）、FP16（AI 推理）和INT8（边缘计算）。这或许是东芯股份在上述方向取得突破的主要原因。

但从行业趋势上来看，东芯股份未来可能亦将在FP8的方向发力。当前主流 AI 框架，如TensorFlow、PyTorch对FP8的支持仍处于早期阶段，且需硬件厂商提供底层驱动和库优化。这对于构建产业生态的国产AI芯片厂商来说，既是挑战也是机会。