使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

自适应估计信号个数的频谱信号提取算法  PDF

  • 单中尧 1
  • 林枫 1
  • 王景岩 2
  • 冯忠明 2
1. 中国电子科技集团公司 第二十二研究所,山东 青岛 266000; 2. 哈尔滨工程大学 信息与通信工程学院,黑龙江 哈尔滨 150001

中图分类号: TN911.72

最近更新:2023-01-11

DOI:10.11805/TKYDA2022044

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

无线电监测频谱数据中包含有大量的信号,准确提取这些信号有利于掌握全频段的频谱使用情况。实际信号的频谱由于受噪声干扰,会出现信号频带内个别频点能量值低于检测门限的情况,此时传统的门限检测算法会将该信号错估为多个信号,产生多个虚假的相邻信号间隔,导致频谱信号提取的准确率下降。对此,根据虚假相邻信号间隔特点,提出一种自适应估计信号个数的频谱信号提取算法,该算法可自动、准确估计频谱监测数据中电磁信号的个数,并将对应的信号及频谱信息提取出来。实验结果表明,该方法具有自适应性、强鲁棒性和高准确性,有效提高了频谱信号提取的准确率,为军、民电磁环境的识别与掌握提供基础的电磁信号数据支撑。

频谱监测数据是反映电磁环境特性最直观、最重要的基础电磁数据。军民用固定频谱监测台站、机动监测站、便携式移动站等感知站每天都会产生大量的频谱监测数据,相关业务人员从这些数据中提取和识别电磁信号,标记各类信号的用频情况和活动规律,并对非法、未知和异常信号进行告警和查处。由于频谱监测数据积累过快且存储量较大,仅凭业务人员根据实际经验来处理大量频谱监测数据在时效性方面是远远不够的;且为了能够正确获取频谱使用情况,信号提取的准确性也是非常重要的衡量指标。因此亟需一种自适应、高准确度的电磁信号提取方法,能够实时、准确提取电磁信号的数量、中心频率、带宽、能量、出现时间等信息,为相关业务人员掌握频谱使用情况、无线电监管执法提供数据支[

1-2]

1 频谱信号提取存在问题

关于自适应电磁频谱信号提取方法,2005年提出了一种基于双门限的信号提取算法(Localization Algorithm based on Double-thresholding,LAD)[

3]。该算法基于前向连续均值去除(Forward Consecutive Mean Excision,FCME),给出信号检测的上、下门限,准确提取信号。该算法用于扩频信号中窄带信号提取、公共安全传输(Public Safety Communications,PSC)系统[4-6],取得了很好的效果。由于LAD算法不需要任何先验知识,计算复杂度低,并且在任何频段内都适用,符合电磁环境频谱监测的应用需求,因此本文将其用于频谱信号的提取工作。

在多数情况下,LAD算法表现出很好的性能,但存在一个很常见的问题:频谱监测得到的实际信号频谱,由于受信道衰落、自身频谱特性、接收机性能等因素影响,会出现在实际信号频谱带宽内的个别频点能量值低于检测门限的情况,导致LAD算法将其错误估计为多个信号,降低了信号提取的准确率。如图1所示,由于信号在其频谱带宽内存在一个低于检测门限的能量值,因此被错误估计成2个信[

7]

图1  信号数量错误估计

Fig.1  False estimation of the signal number

针对这个问题,贾可新等提出了一种加强的LAD窄带信号提取算[

8],使用二值形态学算子对提取信号进行合并,但其结构元素的选择,需要视情况预先设定,结构元素选择不当会严重影响信号提取准确率。J Vartiainen等提出了一种LAD相邻聚簇融合(Adjacent Cluster Combining,ACC)算[9-10],该算法根据连续多帧频谱数据中某频点超过门限的次数来确定该频点是否为信号频点。但该算法并未考虑同一帧频谱数据中相邻频点之间的联系,且这种统计类的算法也很难捕获到只在某一帧数据中出现的突发信号,提取规则中用到的参数也是视场景而预先设定的,并不是自适应的。

由于原始LAD算法错误地提取信号,导致原本为一个信号的宽带信号错分成若干个假信号,产生虚假的相邻假信号间隔。本文根据虚假的相邻信号间隔所具有的特点,结合前向动态平均理论,在原始LAD算法上进行改进,提出了一种自适应估计信号个数(Estimating the Signal Number Adaptively,ESNA)算法。该算法不需要任何先验知识,很好地解决了上述问题,提高了频谱信号提取的准确率。

2 频谱信号提取ESNA算法

2.1 传统频谱信号提取技术

自适应估计信号个数算法首先要获取相邻信号间隔,即通过使用原始LAD算法,对频谱数据进行处理,得到信号提取列表,进而得到相邻信号间[

11]

本文中,待处理频谱数据为某地复杂电磁环境30~3 000 MHz的频谱数据,如图2所示。在该频段内,存在广播信号、数字电视信号、WCDMA信号、数字集群信号等多种业务类型信号,既有窄带信号又有宽带信号,既有模拟调制信号又有数字调制信号。因此该频谱数据具有普适性,涵盖了基本的信号特点和频谱复杂度。对该频谱数据使用原始LAD算法获得的相邻信号间隔也具有普适性,对这组数据进行研究获得的结论可用于其他频谱数据中。

对该组数据进行处理,利用原始LAD算法得到的相邻信号间隔如图3所示。其中,横轴使用采样点数作为单位,表示相邻信号间隔的长度,如,相邻信号间隔长度为3个采样点,表示在频谱上2个独立信号之间的频率差值相差(3×分辨力率带宽)Hz,分辨率带宽是指频谱数据中相邻2个谱线之间的频率长度;纵轴则表示某一种相邻信号间隔值出现的次数,通过归一化处理转换成出现概率。

图3可知,小长度相邻信号间隔出现的概率很高,而其他大长度相邻信号间隔出现概率都很低,并且相差不大。小长度相邻信号间隔出现概率过高,并不代表在该频段内信号数量非常多,相隔非常近,而是因为实际电磁环境很复杂,噪声干扰很强,即使LAD算法中的双门限设置合适,也会出现一个信号错估成多个信号的问题,尤其是宽带信号,这种问题更为明显,导致信号提取的虚警概率大幅度增加,信号的参数被错误估计,严重影响了频谱信号提取的准确[

12]

图2  30~3 000 MHz频谱数据

Fig.2  30~3 000 MHz spectrum data

图3  相邻信号间隔分布

Fig.3  Distribution of adjacent signal interval

2.2 虚假相邻信号间隔特征分析

在信号带宽内,受随机噪声干扰影响,信号频率能量值高于或低于检测门限的情况随机发生。根据原始LAD算法的信号个数估计规则,其产生的若干虚假的相邻信号间隔也应该是随机变化的。这种变化的本质是由随机噪声干扰产生的,因此在检测门限一定的条件下,虚假相邻信号间隔也应该具有与随机噪声干扰相似的某种概率密度函数分布。本文分别使用单边高斯分布、单边瑞利分布和单边指数分布的概率密度函数曲线拟合虚假相邻信号间隔的概率密度函数曲线,采用曲线拟合准确率衡量曲线拟合情况的好坏,由此确定最适合于虚假相邻信号间隔的概率密度函数曲线。

图4  概率密度函数曲线拟合对比

Fig.4  Curve fitting comparison of probability density function

关于拟合准确率,曲线a和曲线b拟合准确率的计算公式为:

ε=1-1Nn=1Nan-bn21Nn=1Nan2×100% (1)

式中:ab分别为2条要进行拟合的曲线数组;Nab的数组长度;ε为拟合准确度。

本文对500组30~3 000 MHz的频谱监测数据进行处理,提取出虚假相邻信号间隔分布曲线。分别使用3种概率密度函数曲线进行拟合,拟合统计结果如表1所示。图4为500组中3个曲线拟合情况的一个快拍。

综合评估统计结果和快拍,认为虚假相邻信号间隔近似服从指数分布。基于这个特点,本文使用纯净抑制[

13]获取区分虚假、真实相邻信号间隔的目标门限计算公式。

表1  曲线拟合统计结果 ( % )
Table1  Statistical results of curve fitting ( % )
curve fittingεmax value/%εmin value/%εaverage value
Gaussian distribution 87.16 63.72 78.98
Rayleigh distribution 66.38 57.72 63.39
exponential distribution 94.24 77.38 86.51

2.3 相邻信号间隔门限推导

对实际频谱监测数据采用LAD算法得到的所有相邻信号间隔记为:

ϕ=si,ni (2)

式中:si为真实相邻信号间隔;ni为虚假相邻信号间隔。

一般情况下,虚假相邻信号间隔要小于通信信道之间的间隔,即小于真实相邻信号间隔,因此需要找到一个间隔门限作为真实间隔和虚假间隔的区分门限,将所有低于间隔门限的都认为是虚假相邻信号间隔。

由文献[

13]可知,门限系数T的计算公式为:

T=ϕtargetEϕ (3)

式中:ϕtarget表示第一个真实相邻信号间隔值,小于该值的都是虚假相邻信号间隔值;Eϕϕ的期望。由于ni为服从指数分布的随机变量,si相对于ni是固定的,因此ϕ是服从指数分布的随机变量,其一阶矩为:

Eϕ=μ (4)

式中:μ为指数分布的参数,指数分布随机变量的累积密度函数(Cumulative Density Function,CDF)为:

Fϕ=1-e-ϕμ (5)

可以从式(5)解得关于ϕ的公式:

ϕ=-μln1-Fϕ (6)

式(4)式(6)代入式(3),可得

T=ϕtargetEϕ   = -μln1-Fϕtargetμ   = -ln1-Fϕtarget (7)

式中:Fϕtarget表示在虚假相邻信号间隔的集合中,被判定成虚假相邻信号间隔的数量百分比,如,Fϕtarget的值为0.99,则表示99%的虚假相邻信号间隔被判定成虚假相邻信号间隔,1%的虚假相邻信号间隔被判定成真实相邻信号间隔。由式(7)计算得到的门限系数T的对应数值如表2所示。

表2  FϕtargetT的对应值
Table2  Fϕtarget and calculated T
FϕtargetT
0.999 6.91
0.990 4.61
0.950 2.99
0.900 2.30

根据式(7)得到门限系数后,使用FCME算法可得到一个目标门限,凡是高于该目标门限的相邻信号间隔,认为是真实的相邻信号间隔;凡是低于该目标门限的相邻信号间隔,则认为是由于随机干扰产生的虚假相邻信号间隔。将相邻的虚假信号进行合并,重新统计信号个数。本文将这个门限叫做间隔门限。下面详细给出依据间隔门限进行信号个数估计的改进LAD算法的步骤及其流程图。

3 自适应估计信号个数算法

3.1 基于LAD算法的相邻信号间隔获取

ESNA算法计算流程如图5所示,详细描述如下:

算法的输入数据为频谱数据Freq(n),个数为N,已知频率分辨率、起始频率、终止频率、各频率点上的幅度值。LAD算法是一种自适应的频谱信号提取算法,使用2个门限来实现信号的提取和噪声的压制。上门限和下门限通过FCM算法迭代计算得到。

1) 首先将各频点上的幅度平方值进行升序排列,记为zi,其中i=1,2,,N。设置I为初始化纯净集合的长度,初始化纯净集合是指纯噪声组成的数据集合。初始化纯净集合的长度I不宜过长,否则会使纯净集合中的含噪率较低,整个LAD算法性能下降。一般情况下,I的值为N的十分之一左右。

2) 开始第一轮迭代,迭代公式如下:

zk+1TCME1ki=1kzi (8)

式中:k可以取得的最大值为ITCME为FCME算法的阈值因子,决定了FCME算法性能的优劣。

TCME代表了噪声的分布情况:

TCME=-lnPFA,DEC (9)

式中PFA,DEC为理想的纯净抑制比。

3) 判断迭代公式。如果迭代值满足式(8),则迭代算法终止,剩下的其他采样点就认为是纯信号;如果始终不满足式(8),则认为当前所有的点都属于初始化纯净集合,kI值继续加1。

4) 如果k=N时,仍找不到一个值满足式(8),则认为此时频谱数据中不包含信号,全部都是噪声数据;如果出现了满足式(8)的值,则迭代算法终止。此时能确定用于压制噪声的下门限T1

图5  ESNA算法计算流程

Fig.5  Calculation flow of the ESNA algorithm

5) 在确定了下门限后,重新规定阈值系数TCME,用于确定上门限T2。根据式(9),本文选择PFA,DEC的值为0.01,则对应的TCME为4.61。

6) 继续采用迭代算法,当满足式(8)时,记录此时的上门限值T2

7) 利用下门限T1进行第一轮筛选,把噪声压制掉。

8) 利用上门限T2进行第二轮筛选,从中摘取信号,获取相邻信号间隔。

3.2 频谱信号个数估计和信号提取

通过上述处理流程可获取全部的相邻信号间隔,进而利用本文推导出的ESNA算法求取真实的相邻信号间隔门限,以此为依据同步更新信号提取列表,详细步骤描述如下:

1) 首先确定间隔门限系数T,由于虚假相邻信号间隔可认为是由噪声干扰产生的,则间隔门限系数T与LAD算法中用来提取信号的阈值门限系数T可以取相同值。

2) 使用LAD算法提取信号,并计算相邻信号间隔,存入阵列a(n)中,其中n=1,2,,N

3) 对集合a作升序排列,取前5%长度的数据作为初始集合b

集合b的长度K=0.05N。设ε为集合a内升序排列的第K+1个元素,依据式(10)进行判断:

1Ki=1KblTε (10)

4) 如果式(10)成立,则将ɛ值存入到集合b中,并且K=K+1,继续寻找下一个间隔值,即集合a内升序排列的第K+1个元素,再进行式(10)的比较,以此类推;如果式(10)不成立,则将bK作为间隔门限。

5) 如果在步骤4)中,集合b的所有值都满足式(10)成立的条件,则将此时集合b中的最大值作为间隔门限。

6) 将集合a中相邻信号间隔低于间隔门限的2个相邻信号进行合并,更新中心频率、带宽等参数,重新统计信号个数,得到新的信号提取列表和信号数量,整个算法结束。

4 算法性能验证

4.1 仿真试验验证

将提出的自适应估计信号个数算法、原始LAD算法、LAD ACC算法和基于形态学的LAD算法进行仿真试验和性能对比。仿真试验中使用高斯白噪声信道,加入2个BPSK调制信号,信号带宽分别为系统带宽的3.36%和15.17%,其中BPSK信号通过滚降因子为0.35的根升余弦滤波器产生。对整个信道做加窗FFT得到频谱数据,其中窗函数使用布莱克曼哈里斯窗,防止频谱泄漏。原始LAD算法下门限系数为2.99Fϕtarget=0.95,上门限系数为4.61Fϕtarget=0.99

LAD ACC算法中r=3,n=5,即每连续5帧频谱数据中某频点上的幅值高于门限3次以上的认为是信号频点;基于形态学的LAD算法,选择一维基础结构元,膨胀尺度设置为3个采样点长度。进行10 000次蒙特卡罗实验,图6为不同信噪比条件下,使用不同算法时的信号个数正确检测概率。

图6  各算法频谱信号提取正确检测概率

Fig.6  Correct detection probability of spectrum signal extraction by each algorithm

信号个数正确检测概率表示算法能够正确估计信号个数的频次。由图6可知,在高信噪比下,ESNA算法在性能上略优于其他算法;原始LAD算法由于没有任何估计信号数量的规则,因此性能很差。在低信噪比条件下,本文提出的ESNA算法的性能要明显优于形态学算法和LAD ACC算法。为了更直观对比4个算法的性能,取一次蒙特卡罗实验的快拍频谱数据,根据频谱数据的特点分析4个算法的性能,如图7图8所示。

图7中,1 020 MHz附近的BPSK信号受到噪声波动影响较大,其频带内的很多频谱能量值都低于下门限。此时用原始LAD算法处理,会得到很多虚假相邻信号间隔,如图8所示。而且,随着噪声一直随机变化,相邻信号间隔也在不停地随机变化。此时,LAD ACC算法或形态学算法这样选择固定的参数、结构元和固定的提取规则,则无法适应噪声的变化,导致错误估计信号数量;本文提出的ESNA算法获得的门限如图8中点划线所示,根据相邻信号间隔的变化情况,可以实时找到准确的间隔门限,具有自适应性;处理后,相邻信号间隔变为1个,从而准确估计出信号的数量为2。因此,在低信噪比的情况下其性能要明显优于其他3种算法。

图7  含两个BPSK信号的功率谱数据

Fig.7  Power spectrum data containing two BPSK signals

图8  相邻信号间隔与间隔门限

Fig.8  Adjacent signal intervals and interval threshold

4.2 实际频谱数据应用验证

选取图3所示的该地区30~3 000 MHz的实际频谱监测数据进行算法验证。验证时,采用切分频段的方式,每个频段长度为300 MHz,共分为10个频段。其中,频段1的范围为30~300 MHz,频段2的范围为300~600 MHz,以此类推,频段10的范围为2 700~3 000 MHz。

图9  多段频谱数据条件下各算法处理性能

Fig.9  Processing performance for multiple ranges of spectrum data by different algorithms

分别使用ESNA算法、LAD ACC算法、形态学算法和原始LAD算法提取信号,并计算信号个数正确检测概率。本文对1 000组30~3 000 MHz频谱数据进行了处理,计算结果如图9所示。

不同频段内的实际频谱监测数据所表现出来的特点不同,导致多频段各算法表现也不一致。频段1和频段6包含超短波电台、广播信号、水上定位和移动信号,其占用带宽较小,多为窄带信号,因此ESNA算法、形态学算法、LAD ACC算法和原始LAD算法的性能较为接近,以LAD算法对窄带信号的有效提取能力发挥为最优;频段5和频段10没有信号,因此信号个数正确检测概率都为100%;其他频段包含有较多的宽带信号,容易出现本文提及的信号个数错误估计问题:原始LAD算法已经无法正常发挥作用;形态学算法、LAD ACC算法虽然起到一定的错误抑制作用,但仍存在局限性;本文提出的ESNA算法,能够有效处理信号个数错误估计问题,正确检测概率也明显高于其他算法。总之,本文提出的ESNA算法在处理各个频段的实际频谱监测数据的性能要优于其他3种算法。

4.3 典型试验结果分析

为更好地观察ESNA算法的性能,取ESNA算法处理实际频谱数据实现信号提取过程的一组快拍数据(频段范围为650~760 MHz),如图10所示。在这个频段内,既含有窄带信号,又含有宽带信号,对其使用原始LAD算法,画出上门限和下门限,出现了很多信号在其带宽内频谱能量值低于下门限的情况,严重干扰了实际信号数量的正确估计。使用本文提出的ESNA算法对其进行处理,首先使用原始LAD算法得到相邻信号间隔,如图11所示,共有66个相邻信号间隔。然后根据ESNA算法画出间隔门限,门限系数与LAD算法所选系数相同。

图10  650~760 MHz频谱数据

Fig.10  650~760 MHz spectrum data

图11  相邻信号间隔与间隔门限

Fig.11  Adjacent signal interval and interval threshold

将相邻信号间隔小于间隔门限的2个相邻信号进行合并,更新信号提取列表。合并后的相邻信号间隔数量为20,与未处理前相比,数量减少了很多,这正是将虚假相邻信号间隔消除后的效果。为验证本算法信号提取的准确性,将提取出的信号及其参数与实际信号及其参数作对比,如表3所示。由表3可知,经过ESNA算法信号数量估计处理后,提取列表中的信号参数与真实信号参数基本一致,特别是准确提取了带宽为7.8 MHz的宽带开路电视信号。本文提出的ESNA算法有效解决了原始LAD算法错误估计信号数量的问题,提高了信号提取的准确率。

5 结论

本文针对频谱信号提取存在信号数量错误估计的问题,提出了一种自适应估计信号个数的频谱信号提取算法。算法充分考虑了噪声干扰特性,结合曲线拟合、纯净抑制比、前向动态平均理论,对信号数量进行自适应估计。实验结果表明,提出的算法能够准确提取不同频段内的宽带、窄带频谱信号,在自适应性、鲁棒性、准确性方面全面优于传统的形态学LAD、LAD ACC和原始LAD算法,可有效解决信号数量错误估计问题。提出的算法在相关项目中已经开始应[

14-15],并取得了很好的效果,未来能够用于固定监测台站、机动监测站、便携式移动站的日常频谱监测工作。

参考文献

1

姬生云,黄付庆,冯晓哲,. 区域频谱资源数据融合方法[J]. 电波科学学报, 2013,28(4):782-787. [百度学术] 

JI Shengyun,HUANG Fuqing,FENG Xiaozhe,et al. Method for region data fusion of spectrum resource[J]. Chinese Journal of Radio Science, 2013,28(4):782-787. [百度学术] 

2

张思成,林云,涂涯,. 基于轻量级深度神经网络的电磁信号调制识别技术[J]. 通信学报, 2020,41(11):12-21. [百度学术] 

ZHANG Sicheng,LIN Yun,TU Ya,et al. Electromagnetic signal modulation recognition technology based on lightweight deep neural network[J]. Journal on Communications, 2020,41(11):12-21. [百度学术] 

3

VARTIAINEN J,LEHTOMAKI J,SAARNISAARI J. Double-threshold based narrowband signal extraction[C]// 2005 IEEE 61st Vehicular Technology Conference. Stockholm,Sweden:IEEE, 2005:1288-1292. [百度学术] 

4

BAO Z,LIN Y,ZHANG S,et al. Threat of adversarial attacks on DL-based IoT device identification[J]. IEEE Internet of Things Journal, 2021,9(11):9012-9024. [百度学术] 

5

TU Y,LIN Y,ZHA H,et al. Large-scale real-world radio signal recognition with deep learning[J]. Chinese Journal of Aeronautics, 2022,35(9):35-48. [百度学术] 

6

TU Y,LIN Y,HOU C,et al. Complex-valued networks for automatic modulation classification[J]. IEEE Transactions on Vehicular Technology, 2020,69(9):10085-10089. [百度学术] 

7

LEHTOMAKI J,VARTIAINEN J,JUNTTI M,et al. Analysis of the LAD methods[J]. IEEE Signal Processing Letters, 2008(15): 237-240. [百度学术] 

8

JIA K,HE Z. Narrowband signal localization based on enhanced LAD method[J]. Journal of Communications and Networks, 2011,13(1):6-11. [百度学术] 

9

VARTIAINEN J,SARVANKO H,LEHTOMAKI J,et al. Spectrum sensing with LAD-based methods[C]// 2007 IEEE 18th International Symposium on Personal,Indoor and Mobile Radio Communications. Athens,Greece:IEEE, 2007:1-5. [百度学术] 

10

LEHTOMAKI J,SALMENKAITA S,VARTIAINEN J,et al. Measurement studies of a spectrum sensing algorithm based on double thresholding[C]// 2009 Second International Workshop on Cognitive Radio and Advanced Spectrum Management. Aalborg,Denmark:IEEE, 2009:69-73. [百度学术] 

11

SAARNISAARI H,HENTTU P,JUNTTI M. Iterative multidimensional impulse detectors for communications based on the classical diagnostic methods[J]. IEEE Transactions on Communications, 2005,53(3):395-398. [百度学术] 

12

LEHTOMAKI J,VARTIAINEN J,JUNTTI M,et al. CFAR outlier detection with forward methods[J]. IEEE Transactions on Signal Processing, 2007,55(9):4702-4706. [百度学术] 

13

HENTTU P,AROMAA S. Consecutive mean excision algorithm[C]// IEEE 7th International Symposium on Spread Spectrum Techniques and Applications. Prague,Czech Republic:IEEE, 2002:450-454. [百度学术] 

14

LIN Y,TU Y,DOU Z,et al. Contour stella image and deep learning for signal recognition in the physical layer[J]. IEEE Transactions on Cognitive Communications and Networking, 2021,7(1):34-46. [百度学术] 

15

LIN Y,TU Y,DOU Z. An improved neural network pruning technology for automatic modulation classification in edge devices[J]. IEEE Transactions on Vehicular Technology, 2020,69(5):5703-5706. [百度学术]