摘要
针对当前智能抗干扰技术在面对快速变化的干扰表现较差的问题,提出结合先验知识网络的新型智能抗干扰技术。首先构建先验知识网络,根据历史干扰信息实现对下一时刻干扰信息的预测,使系统更好地应对快速变化的干扰;然后利用强化学习算法实现对新的干扰规律的在线学习,使算法可以适用于干扰动态变化超出离线学习模型适应范围的场景。将所提算法与无先验知识的强化学习算法进行仿真对比,结果表明,所提算法在面对快速变化的干扰时,具有更高的决策准确率和更快的收敛速度,并对环境有较好的适应性,能够有效地进行智能抗干扰。
随着无线通信技术的发展,通信内容越来越丰富的同时,信息传输环境也愈发复杂多
智能抗干扰技术的核心是实时决策,系统实时智能决策出当前应该采用的最佳通信策略参数配
目前决策算法的研究主要有两类:一类是使用机器学习算
针对以上问题,本文提出一种结合先验知识的基于强化学习的智能抗干扰技术。该技术通过历史干扰参数预测下一时刻的干扰参数,然后决策出下一时刻的最优通信策略;同时强化学习算法使系统拥有在线学习能力,在干扰动态变化超过离线学习模型适应范围的情况下,可以利用在线学习能力学习新的干扰规律以适应动态变化的干扰。该技术还通过引入先验知识网络,解决强化学习带来的无效探索过多、收敛速度慢的问题。
系统模型由发射方、接收方和干扰方组成,如

图1 信号传输与干扰模型
Fig.1 Signal transmission and interference model
假设用户在t时刻发射信号的中心频率为,功率为,传输带宽为,噪声的功率谱密度(Power Spectral Densities,PSD)函数为,干扰信号的函数为,表示传输链路的信道增益,表示干扰链路的信道增益。则信干噪比(Signal to Interference plus Noise Ratio,SINR)为:
(1) |
然后可以根据接收到的信干噪比是否大于成功通信的阈值,判断通信是否成功,判断公式为:
(2) |
式中为成功传输的的阈值。当接收到的信噪比大于阈值时,反馈为1,视为传输成功;否则,反馈为0,视为传输失败。
传统智能抗干扰决策系统只能感知目前的干扰信息,然后通过目前的干扰信息进行决策,并将决策出的最优策略发送给发射机,让发射机按照最优策略进行通信。对于干扰快速变化的情况如果仍用上一时刻干扰信息得到的最优策略进行通信,会出现无法通信或无法实现最优通信的情况。本文提出的智能抗干扰技术主要是为了应对干扰信号快速动态变化场景,即干扰变化周期快于通信周期的情况。
提出的先验知识网络的构建过程如

图2 先验知识网络模型
Fig.2 Network model of prior knowledge
(3) |
预测网络为长短时记忆(Long Short Term Memory,)网络,网络主要用于序列数据,并且有一定的记忆效应,能够比其他的网络更好地处理时间序列的任务。预测网络主要利用管理器传输的历史到时刻的干扰信息,实现对时刻干扰信息的预测,可以较好地应对快速变化的干扰。决策网络为深度神经网络(Deep Nueral Network,),主要对预测出的干扰信息下不同策略进行评价,得到时刻的干扰信息所对应的所有通信策略的通信质量。
先验知识网络构建后,将其融合到本文设计的通信智能抗干扰结构中,其结构如

图3 融合先验知识网络的通信智能抗干扰结构
Fig.3 Intelligent anti-interference structure of communication based on prior knowledge network
发射机通过可靠传输链路生成通信信号,接收机接收到信号后,通过管理器进行数据处理。管理器对提取到的干扰信息进行归一化等数据处理后,将总干扰信息与所有可选策略一起送入先验知识网络中。先验知识网络根据信息预测出时刻的干扰信息下所有可选通信策略的评价,并通过目标函数得到下一时刻通信的最优策略,最终将最优策略通过可靠传输链路反馈给发送方。
在预测最优策略的同时,将上一次通信过程中的数据作为历史经验存入经验回访池中。每一组数据包括上一次通信的历史干扰信息、预测出的新时刻的干扰信息、上一次通信所使用策略以及以策略进行通信后的反馈。反馈
(4) |
式中:为信号是否传输成功的反馈;为传输功率的成本,其中为单位传输功率的成本。通信过程中,发射功率越大,发射成功的概率就越高。如果对发射机的发射功率没有约束,则系统决策出的最佳通信策略会始终选择最大的发射功率。引入传输成本概念后,系统在决策时会考虑功率的影响,会把能够以尽可能低的功耗实现成功的传输策略作为最优策略。
随着通信的进行,经验回放池的数据会不断地累积,当其中的数据积累到一定程度后,则开始根据设定的网络更新周期,周期性地从经验回放池中抽取一定批量的数据对网络进行再训练,不断更新网络的参数。在通信过程中对网络做进一步的优化,一方面可以得到更好的通信质量,另一方面也让网络有了适应新的干扰规律的能力。
融合先验知识的智能抗干扰算法如下:
初始化:经验池D,数据批量B,策略集AN,网络更新周期T
输出:返回给发射机的策略at+1
While(True)
接收机获取环境状态St以及上一时刻通信策略at、通信策略的反馈rt,以及通信次数N
将[St, St+1, at, rt]作为一组历史数据存入经验池D中
Q=net(St, AN)//net为先验知识网络
Qmax=max(Q)
Qmaxat+1//得到最大的Q值对应的策略at+1
if N%T=0
从D中随机抽取B组数据对当前网络进行训练
更新当前网络
end
end
仿真过程的通信系统包含4种策略维度,分别为通信的调制方式、通信频点、信号功率及信号带宽,具体参数如
modulation type | BPSK, QPSK, 16QAM |
---|---|
communication frequency | 2.4 GHz+3 MHz, 2.4 GHz+6 MHz, …, 2.4 GHz+27 MHz |
power/mW | 50, 100, …, 500 |
bandwidth/MHz | 0.6, 1.2, 2.4 |
仿真过程中通信质量采用信号解调后的误差矢量幅度值(Error Vector Magnitude,EVM)进行衡量。EVM值与SINR之间的关系如
(5) |
modulation type | BPSK | QPSK | 16QAM |
---|---|---|---|
0.3 | 0.175 | 0.125 |
先验知识网络的损失函数为均方误差(Mean Square Error,MSE)函数,均方误差函数的优点是对网络训练中的较大或较小误差非常敏感,如
(6) |
parameter | value | |||
---|---|---|---|---|
bandwidth/MHz | 30 | 30 | 20 | 20 |
speed/(MHz/s) | 450 | 400 | 450 | 400 |
training set results | 0.020 1 | 0.019 9 | 0.018 5 | 0.018 2 |
test set results | 0.020 9 | 0.019 5 | 0.018 8 | 0.018 5 |
文中设置已有先验知识的干扰为扫频干扰,从
为验证所提算法的可行性与有效性,本文进行了大量的仿真实验。仿真过程中设置已有先验知识的干扰规律如

图4 扫频干扰频谱图
Fig.4 Spectrum diagram of sweep interference

图5 扫频干扰下两种算法结果对比图
Fig.5 Comparison of results of two algorithms under sweep interference
从
验证所提算法对新的干扰规律的适应性。将原来的干扰规律进行改变,新的干扰规律设置为:在之前的干扰规律的基础上新增2种不同的干扰规律,分别为有3个固定频段(3~9 MHz、12~18 MHz、21~27 MHz)的梳状干扰及扫频宽度为30 MHz、扫频速度为450 MHz/s的双扫频干扰。干扰规律在3种规律中随机变化,其频谱如

图6 多种干扰频谱图
Fig.6 Multiple-interference spectra
在通信50次后,将干扰规律从开始的只有1种扫频干扰变为3种干扰规律随机选择,仿真结果见

图7 新增干扰规律时两种算法结果对比图
Fig.7 Results comparison of two algorithms when adding the interference rules
本文研究了快速变化通信环境下的智能抗干扰技术,提出了一种结合先验知识的基于强化学习的高维策略智能抗干扰算法。通过引入先验知识引导算法的策略选择过程,证明了该算法能够有效应对快速变化的规律性干扰,算法的收敛速度显著提升,并对新的干扰规律有很好的适应性。
参考文献
杨同茂. 军事通信抗干扰技术的发展现状及趋势[J]. 通信技术, 2014,47(7):707-712. [百度学术]
YANG Tongmao. Developing status quo and trend of military communications anti-jamming technology[J]. Communications Technology, 2014,47(7):707-712. doi:10.3969/j.issn.1002-0802.2014.07.001. [百度学术]
ZOU Yulong,ZHU Jia,WANG Xianbin,et al. A survey on wireless security:technical challenges,recent advances,and future trends[J]. Proceedings of the IEEE, 2016,104(9):1727-1765. doi:10.1109/JPROC.2016.2558521. [百度学术]
LI Haitao,LUO Jiawei,LIU Changjun. Selfish bandit-based cognitive anti-jamming strategy for aeronautic swarm network in presence of multiple jammer[J]. IEEE Access, 2019(7):30234-30243. doi:10.1109/ACCESS.2019.2896709. [百度学术]
陈会林,教富龙,袁泮江,等. 一种智能抗干扰无人机测控系统设计[J]. 电讯技术, 2021,61(6):703-709. [百度学术]
CHEN Huilin,JIAO Fulong,YUAN Panjiang,et al. Design of an intelligent anti-jamming TT&C system for UAV[J]. Telecommunication Engineering, 2021,61(6):703-709. doi:10.3969/j.issn.1001-893x.2021.06.007. [百度学术]
JIAO Jiyu,SUN Xuehong,FANG Liang,et al. An overview of wireless communication technology using deep learning[J]. China Communications, 2021,18(12):1-36. doi:10.23919/JCC.2021.12.001. [百度学术]
JIANG Kun,SU Dan,ZHENG Yanfu. Intelligent acquisition model of traffic congestion information in the vehicle networking environment based on multi-sensor fusion[J]. International Journal of Vehicle Information and Communication Systems, 2019, 4(2):155-169. doi:10.1504/IJVICS.2019.101512. [百度学术]
GALANOPOULOS A,FOUKALAS F,TSIFTSIS T A. Efficient coexistence of LTE with WiFi in the licensed and unlicensed spectrum aggregation[J]. IEEE Transactions on Cognitive Communications and Networking, 2016,2(2):129-140. doi:10.1109/TCCN.2016.2594780. [百度学术]
李少谦,程郁凡,董彬虹,等. 智能抗干扰通信技术研究[J]. 无线电通信技术, 2012,38(1):1-4. [百度学术]
LI Shaoqian,CHENG Yufan, DONG Binhong,et al. Research on intelligent anti-jam communication techniques[J]. Radio Communications Technology, 2012, 38(1):1-4. doi:10.3969/j.issn.1003-3114.2012.01.001. [百度学术]
HANAWAL M K,ABDEL-RAHMAN M J,KRUNZ M. Joint adaptation of frequency hopping and transmission rate for anti-jamming wireless systems[J]. IEEE Transactions on Mobile Computing, 2016,15(9):2247-2259. doi:10.1109/TMC.2015. 2492556. [百度学术]
WANG Jingjing,LIU Meng,ZHANG Yi. Research on intelligent anti-jamming communication with cognitive radio[J]. EAI Endorsed Transactions on Cognitive Communications, 2018,4(14):155074. doi:10.4108/eai.11-5-2018.155074. [百度学术]
ZHAO Lingli. Design of intelligent water-saving irrigation system based on internet of things[J]. Wireless Engineering and Technology, 2022,13(3):33-40. doi:10.4236/wet.2022.133003. [百度学术]
徐甜甜,韩光洁,邹岩,等. 基于混合机器学习的电磁功率谱密度预测模型[J]. 太赫兹科学与电子信息学报, 2021,19(4):623-627. [百度学术]
XU Tiantian,HAN Guangjie,ZOU Yan,et al. Electromagnetic power spectrum density prediction model based on hybrid machine learning[J]. Journal of Terahertz Science and Electronic Information Technology, 2021,19(4):623-627. doi:10.11805/TKYDA2021084. [百度学术]
PIRAYESH H,ZENG H C. Jamming attacks and anti-jamming strategies in wireless networks: a comprehensive survey[J]. IEEE Communications Surveys & Tutorials, 2022,24(2):767-809. doi:10.1109/COMST.2022.3159185. [百度学术]
JIAN Yang,LI Yang. Research on intelligent cognitive function enhancement of intelligent robot based on ant colony algorithm[J]. Cognitive Systems Research, 2019(56):203-212. doi:10.1016/j.cogsys.2018.12.014. [百度学术]
MNIH V,KAVUKCUOGLU K,SILVER D,et al. Human-level control through deep reinforcement learning[J]. Nature, 2015(518): 529-533. doi:10.1038/nature14236. [百度学术]
NOH S. Decision-making framework for autonomous driving at road intersections:safeguarding against collision,overly conservative behavior,and violation vehicles[J]. IEEE Transactions on Industrial Electronics, 2019,66(4):3275-3286. doi: 10.1109/TIE.2018.2840530. [百度学术]
XU Jianliang,LOU Huaxun,ZHANG Weifeng,et al. An intelligent anti-jamming scheme for cognitive radio based on deep reinforcement learning[J]. IEEE Access, 2020(8):202563-202572. doi:10.1109/ACCESS.2020.3036027. [百度学术]
BIN ISSA R,DAS M,RAHMAN M S,et al. Double deep Q-learning and faster R-CNN-based autonomous vehicle navigation and obstacle avoidance in dynamic environment[J]. Sensors, 2021,21(4):1468. doi:10.3390/s21041468. [百度学术]