本文探讨了在实际战场场景中增强态势感知的联合通信和传感技术。特别是,提出了一种空中可重构智能表面(ARIS)辅助综合传感与通信(ISAC)系统,该系统由单个接入点(AP)、ARIS、多个用户和一个传感目标组成。通过深度强化学习(DRL),在信号干扰比(SINR)约束条件下联合优化了接入点的发射波束成形、RIS 相移和 ARIS 的轨迹。数值结果表明,通过抑制自干扰和杂波回波信号或优化 RIS 相移,所提出的技术优于传统的基准方案。
随着设备种类的增加,战场环境变得更加复杂多变,对先进无线传感与通信技术的需求也在不断增加。最近,综合传感与通信(ISAC)被认为是未来使用毫米波(mmWave)等高频段无线网络的一项有前途的技术[1]。特别是,由于雷达传感和无线通信共享相同的频谱和硬件设施,ISAC 有可能提高战场上的整体作战效率[2]。
ISAC 下行链路系统的整体流程一般是由接入点(AP)向用户发射 ISAC 信号,并处理目标反射的回波信号。然而,由于链路的主要视距(LoS)信道特性,军事场景中的 ISAC 无法避免被各种障碍物(如山脉)阻挡的问题,并随着通信距离的增加而造成严重的路径损耗[3]。为了克服 LoS 信道的物理限制,可重构智能表面(RIS)作为一种关键技术应运而生,它通过调整相移来重新配置信号传播,从而扩大目标探测和通信范围[4],[5]。作者在文献[5]中提出了 RIS 辅助单目标多用户 ISAC 系统中的联合发射和接收波束成形技术。然而,在接入点和地面节点之间部署地面 RIS 在动态战场环境中提供足够的服务质量(QoS)方面存在局限性。另一方面,将 RIS 安装在无人飞行器(UAV)上的空中 RIS(ARIS)可利用移动性在动态战场环境中提供更有效的感知和通信性能[6]。文献[7]考虑了由 ARIS 辅助的 ISAC 系统,以重新配置传播环境,灵活对抗恶意干扰。
之前的研究[6]、[7]中针对传感或通信网络的 ARIS 系统的解决方案大多是通过凸优化提供的,无法快速应用于战场场景。深度强化学习(DRL)方法因其在通过深度神经网络与环境交互的同时制定策略的优势,已被积极采用,作为传统优化方法的替代方案。在 DRL 算法中,众所周知,深度确定性策略梯度(DDPG)在连续行动空间(如 ARIS 轨迹)中收敛和运行良好[8]。文献[9]的作者提出了一种基于 DRL 的 ARIS 轨迹设计,用于与车辆进行通信和定位。然而,从实际角度来看,当 AP 工作在全双工模式时,自干扰问题 [10] 不可忽视,而且还需要一种抑制杂波回波信号的方法 [3]。
这项工作的重点是军事场景中基于 DRL 的 ARIS 辅助 ISAC 系统,其中多天线 AP 为地面用户提供服务并探测目标。我们的目标是通过联合优化发射波束成形、RIS 相移和 ARIS 轨迹,使目标定位的 Cramer-Rao 约束(CRB)[11] 最小化。此外,为了应对自干扰和杂波回波信号带来的挑战,我们采用了一种基于无效空间投影(NSP)的接收波束成形方案[12]来抑制这些信号。为了应对所提问题的非凸性,我们提出了一种基于 DDPG 的算法,在与环境交互的同时寻找最优策略。通过模拟验证,所提出的方法优于其他基准方法,如固定 RIS 相移或不应用基于 NSP 的接收波束成形方案。
本文的其余部分安排如下: 第二节介绍系统模型,包括 ARIS 辅助 ISAC 系统的信道、通信和雷达传感模型。第三节介绍了所提出的基于 DRL 的算法,该算法旨在最小化整个系统的 CRB。第四节展示了数值结果,第五节为本文的结论。