韩国研究人员根据模仿人类大脑的结构和功能的原理,开发出了世界上第一个以超低功耗处理大型语言模型(LLM)的超高速人工智能(AI)半导体。该半导体成功运行了GPT 2,功耗仅为英伟达A100 GPU的1/625,尺寸仅为英伟达A100的1/41。这一突破被认为是正在升级的全球人工智能半导体战争的关键进展。
韩国科学技术院(KAIST)PIM半导体研究中心和AI半导体研究生院的Yu Hoi-jun教授研究组3月6日发表了利用三星电子28纳米工艺开发出的超低功耗“互补变压器”半导体。
据悉,以往操作GPT 2需要多个GPU并消耗250瓦的功率。但是,Yu Hoi-jun教授的研究小组利用4.5×4.5毫米的单个AI半导体,仅用400毫瓦的功率就在0.4秒内处理了GPT 2。这项研究的结果于2月19日至23日在美国旧金山举行的国际固态电路会议(ISSCC)上发表并展示。
“互补变压器”是一种可以选择性地使用模拟大脑神经元处理信息方式的“尖峰神经网络”(SNNs)和能够识别复杂模式并通过多层神经网络进行学习的人工智能模型“深度神经网络” (DNNs)的技术。它模仿了人类大脑运作的原理,即能量消耗随认知负荷而变化。该技术通过对大输入值使用DNNs和对小输入值使用SNNs来最大限度地降低功耗。
(校对/刘昕炜)