近日,中山大学电子与信息工程学院(微电子学院)王玺钧副教授、陈翔教授团队在6G图像语义通信领域最新研究成果被无线通信领域顶级期刊IEEE Wireless Communications录用,论文题目为“Trustworthy Image Semantic Communication with GenAI: Explainablity, Controllability,and Efficiency”。王玺钧副教授为该项成果的第一作者,2024届硕士生叶东山为学生第一作者,埃塞克斯大学冯晨远研究员、浙江大学杨浩助理教授、我院陈翔教授以及IEEE Fellow、新加坡科技设计大学Tony Q.S. Quek教授为合作作者。
在当今数字化时代,通信系统数据流量呈爆炸式增长,网络拥堵和系统低效问题愈发严重。而语义通信,作为极具前景的下一代6G通信技术,正成为解决这些难题的关键技术之一。其中,图像语义通信对于实现高效的视觉内容传输起着至关重要的作用。然而,目前基于联合信源信道编码的图像语义通信系统却面临着可解释性差、可操作性低以及兼容性不足等诸多挑战。
为解决上述难题,王玺钧副教授团队创新性地提出了可信语义通信框架,并融合人工智能驱动无线接入网(AI RAN)技术,为6G图像语义传输带来了新的解决思路。基于AI RAN赋予的强大智能决策和分析能力,该研究提出的框架运用文本提取和分割映射技术,将图像精准转化为可解释的语义(如语义文本和分割图),极大提升了可解释性与人类理解度。而接收端则利用生成式人工智能、借助AI RAN的高效实时处理能力,快速精准执行下游推理。而内嵌的语义级多速率传输协议,则借助AI RAN的实时解析和数据重构优势,高效完成语义内容和任务需求的动态调整,从而提高系统整体的适应性和效率。此外,该框架还摒弃传统无线AI的收发联合训练模式,解耦收发器的训练相关性,提升了基于AI的语义通信范式的可操作性。
本研究成果提出的可信图像语义通信框架
研究团队还对该框架进行了多应用场景的适配与测试。在多任务场景中,基于 COCO 数据集的评估结果表明,所提方法在图像字幕生成任务上,机器翻译评价指标远超传统数字系统;在图像重建任务中,其语义感知指标表现更为出色。在多速率通信场景下,无论是单用户单任务还是单用户多任务模式,该框架借助 AI RAN 的原生智能分析能力,按任务需求逐级解析/传输语义信息,极大提升了任务完成的效率和质量。
可信图像语义通信框架多场景测试示例
基于该框架,研究团队还设计了基于可解释语义的图像语义通信演示系统。该系统已经在第十三届中国国际通信大会(ICCC 2024,杭州)和第二届未来通信和网络国际会议(FCN 2024,马耳他)上成功亮相,并被美国国家仪器有限公司(NI)2025年度用户手册收录。系统将图像转换为可解释的语义文本和分割图分别传输,利用语义载体通用性解耦收发器训练,实现了图像传输任务超 100 倍的压缩效率,展现了融合AI RAN的可信图像语义通信框架在未来6G领域的巨大潜力。
基于可解释语义的6G图像通信演示系统入选NI无线手册