7月18日,第五届RISC-V中国峰会在上海举行,晶心科技总经理兼技术长苏泓萌在人工智能分论坛上发表了题为《基于RISC-V处理器的大型AI/ML SoC架构创新》的演讲,分享了晶心科技在该领域的最新成果与未来布局。
晶心科技基于RISC-V的Meta架构已在多个AI加速器场景中落地应用。例如,在服务器级AI SoC领域,基于SRAM的计算内存加速器通过Andes处理器优化数据流,大幅提升了矩阵运算效率。在光子学AI加速器方面,晶心科技与LIGHTELLIGENCE、后摩智能等企业合作,借助RISC-V的低延迟特性,突破了传统电子计算的带宽瓶颈。
此外,在边缘与云端协同的AI加速器中,晶心科技通过多核集群架构实现了算力与能效的平衡,为ADAS、智能监控等领域提供了定制化解决方案。苏泓萌指出,RISC-V的灵活性使得晶心科技能够快速适配不同客户的需求,无论是服务器级AI芯片还是边缘端低功耗设备。
在Meta MTIA(Meta Training and Inference Accelerators)架构中,Andes处理器通过扩展自定义指令(如ACE-RVV和ACE标量),与矩阵乘法加速器(AMM)协同工作,显著提升了AI SoC的性能。
多核并行架构与处理器创新
在大型AI/ML SoC设计中,晶心科技采用了“Sea of PE’s”(Processing Elements)设计,通过Mesh互联的多核集群实现高效计算。每个PE单元内集成了标量、向量和矩阵运算能力,支持从基础标量处理到复杂矩阵乘法的全场景需求。例如,在AI推理中,PE单元可通过向量扩展(RVV)加速GEMM(通用矩阵乘法),并通过自定义指令(ACE)优化Softmax、ReLU等激活函数。
晶心科技最新推出的AX46MP(V)计算/控制处理器进一步强化了这一能力。该处理器基于AX45MPV的成功经验,升级至8核集群架构,支持1024位VLEN/DLEN(向量长度),并引入双发射机制(双向量/标量指令),显著提升了吞吐量。
此外,在内存优化方面,AX46MP(V)采用了双加载/单存储设计、私有L2缓存(64KB-512KB,8路关联)和HVM(High-speed Vector Memory)接口的多请求并行与乱序数据返回,有效解决了内存带宽瓶颈,为AI模型训练和推理提供了高效的数据流支持。
矩阵加速与端到端解决方案
晶心科技的AMM矩阵加速技术针对AI核心的矩阵乘法运算进行了优化。该方案通过PE(处理单元)架构支持GEMM、GEMV等操作,并加速Softmax、Sigmoid等特殊函数,同时兼容数据并行计算模式。
AMM与RVV的深度整合,使得无需专用加速器即可实现高效的矩阵运算,为服务器级AI SoC提供了更灵活的解决方案。AndesAIRE端到端AI/ML解决方案覆盖了从模型开发到部署的全流程。
该方案兼容PyTorch、TensorFlow Lite等主流框架,并通过XNNPACK、MLIR、LLVM等开源工具链实现跨平台优化。通过ACE(Automated Custom Extensions)技术,开发者可快速将算法转化为硬件指令,例如在TinyLLaMA 1.1B模型中,仅依赖RVV向量扩展即可实现26.7倍的性能加速。
此外,结合AnDLA I350加速器与SoC硬连线引擎,AndesAIRE支持从FP8到BF16的混合精度计算,满足LLM(大语言模型)的多样化需求。
RISC-V生态共建与未来展望
苏泓萌强调,RISC-V的成功离不开生态协作。过去六年,晶心科技持续扩展RISC-V AI/ML处理器产品线,并与RISE、RISC-V国际基金会等组织深度合作,推动XNNPACK、MLIR等软件工具的标准化。根据SHD集团数据,晶心科技在过去两年稳居RISC-V IP市场份额前列,其AX系列处理器已广泛应用于服务器、汽车、工业等领域。
展望未来,苏泓萌呼吁更多开发者加入RISC-V生态:“AI/ML的快速发展需要开放架构的支撑。无论是定制指令开发,还是软件栈优化,RISC-V都能提供最灵活的解决方案。”晶心科技将继续致力于推动RISC-V在AI/ML领域的应用与发展,为全球开发者提供更强大的技术支持与创新平台。