OpenAI在得克萨斯州的超大型数据中心已成为全球最大的AI设施,拥有数十万个 AI GPU,其电力消耗达到300兆瓦,超过埃隆·马斯克的xAI公司建造的拥有20万个 GPU的250兆瓦数据中心Colossus。据报道,OpenAI正在扩建该设施,计划到2026年中期将其规模扩大到千兆瓦级别,这一发展引发了对电网稳定性的担忧。
目前,OpenAI运营的这座数据中心被描述为“世界上最大的单体数据中心建筑”,IT负载容量约300兆瓦,最大电力容量约500兆瓦。该设施包括210个风冷变电站和一个巨大的现场电力变电站,进一步凸显了其庞大规模。截至2025年1月,第二座完全相同的建筑已在同一地点开始建设。建成后,该园区的总容量将达到约1000兆瓦,创下新纪录。
这些发展已引起得克萨斯电力可靠性委员会(ERCOT)的关注,该组织负责监督得克萨斯电网,因为此类设施的规模和能源需求前所未有。这些数据中心的电力消耗模式以及快速增长,给能源供应公司带来了严峻挑战。
首先,数十万台AI加速器(如英伟达的H100或B200)和服务器消耗大量电力,需要持续供应相当于中型城市消耗量的电力。提供这种负载迫使电力公司以远超常规速度建设或升级变电站、输电线路和发电能力,这对原本未准备应对如此快速增长的地区的财务和物理基础设施规划造成压力。
其次,这些数据中心的用电方式不稳定。与传统工厂或办公楼稳定用电不同,AI数据中心可能在瞬间从最大需求转为最小使用量。这种行为给电网管理带来巨大压力,因为供需之间即使轻微的不平衡也会导致电压和频率问题。
具体而言,当电力产出超出需求时,电压和频率均会升高;反之,若需求超过供应,它们则会降低。任何一方偏离10%都可能对电子设备造成损害或触发电路保护机制。电网运营商肩负着将这些关键参数维持在安全界限内的责任,以确保系统的稳定性。但是,如果多个大型数据中心(或单一巨型数据中心,例如OpenAI所使用的)突然减少电力消耗,可能会对电网的其他部分造成冲击,导致其他电力用户或发电设施关闭,潜在地引发连锁故障。
第三,将这些数据中心并入电网需要与区域规划机构进行复杂的协调工作。这些机构会预先进行详尽研究,以评估对输电稳定性的影响,并预防与其他电网用户的潜在冲突。然而,这些研究往往耗时漫长,难以跟上数据中心建设的快速步伐。
最后,电力公司可能需要投入数十亿美元来满足大型数据中心的电力需求,这无疑是一个经济上的挑战。然而,AI行业的不确定性意味着投资回报难以准确预测。同时,如果电网升级跟不上需求增长的速度,就可能停电,或限制那些无法竞争有限电网容量的工业客户用电。(校对/赵月)