海洋环境状况的变化影响着人类海上生产生活的安全,对海况进行实时监测十分必要[1].海浪场作为海洋动力学参数三要素之一,是人类进行海洋遥感的重要观测对象.高频表面波雷达(HFSWR)具有超视距、全天候、低成本[2]等特点,是近岸浪场遥感的理想设备,而采用单极子交叉环接收天线的紧凑型[3]HFSWR是其重要发展方向[4].基于HFSWR的浪高反演理论框架最早是由Barrick于1972年提出的一、二阶散射截面方程导出,其主要思想是从海洋回波一阶峰和二阶连续谱中获取海浪谱信息,进而反演浪高[5-7].但这些方法都建立在窄波束雷达的前提下,紧凑型HFSWR波束较宽的特性,使上述方法受到限制.为此一些学者改变思路,利用一、二阶谱峰提取海浪信息.文献[8]提出利用一阶布拉格峰值功率估计浪高的经验算法,但由于高海况下布拉格峰饱和与诺顿衰减因子的影响,限制了算法的浪高探测上界.文献[9]提出二阶峰与一阶峰功率比(RSB)与浪高的线性回归模型,提升了浪高探测的上界,减轻了衰减因子的影响.但由于二阶峰信噪比(SNR)远低于一阶峰SNR,因此该算法在低海况和探测距离上受到了限制.文献[10]理论推导传播距离与方向扩展对RSB的影响,将改进的线性模型运用于大范围的浪场反演,使得浪场反演精度进一步提高.事实上,上述雷达回波参数与浪高之间的关系往往不是简单的解析关系,采用简单的解析公式量化该关系往往会带来浪高反演误差[11].因此,本研究利用BP神经网络较强的学习能力和非线性拟合能力[12],将雷达回波参数中提取的一阶峰功率、二阶峰功率、RSB作为网络输入,欧洲中期气象预报中心(European Centre for Medium-Range Weather Fore-casts,ECMWF)数据集[13]提供的有效浪高数据作为网络输出,训练出回波参数与浪高之间更准确的关系模型.然后将雷达回波参数代入模型,实现紧凑型HFSWR浪场的高精度反演.对同一区域不同时段的浪高场反演实验表明该算法精度较高,优于采用线性模型拟合RSB与浪高关系的方法.1 紧凑型HFSWR浪高反演原理由雷达方程和海洋表面一二阶散射截面可知:雷达回波多普勒(Doppler)谱中,一阶峰功率、二阶峰功率及RSB,均会随着海态的增加而增加.因此,可以通过对三者功率的估计实现浪高反演.三种功率与浪高的模型可统一表示为P=f(HS),式中:P为一阶峰功率P1、二阶峰功率P2或RSB强度;HS为有效浪高;f(•)为HS和P的对应关系.在已有的研究中,通常采用线性模型表示RSB强度和HS的关系,采用对数模型表示P1或P2与HS的关系.一般地,采用雷达估计的回波参数与原位浮标等提供的有效浪高进行拟合,获取对应的拟合模型,从而实现浪高反演.在实际中,这些雷达回波参数与浪高之间往往不是简单的映射关系,难以通过固定的拟合模型得到[11],而简化的拟合模型会使得反演的浪高产生较大误差.BP神经网络作为解决数据回归分析问题的常用工具,因其精度高、适应性强的特性,在业界已有广泛应用[12].本研究将通过雷达回波参数和有效浪高数据训练神经网络,得到回波参数与浪高间更准确的关系模型,以提高浪场反演精度.2 BP神经网络拟合模型2.1 BP神经网络构建浪高场是由一定距离和角度范围的单点浪高共同组成的.实验中浪场的时间分辨率为0.5 h.BP神经网络由输入层、隐藏层和输出层三部分构成,隐藏层根据网络复杂程度可选择一层或多层.各层含有一至多个神经元,相邻层间神经元通过权值和阈值连接.图1展示了所搭建的浪高反演拟合网络基本结构.10.13245/j.hust.210420.F001图1有效浪高反演的BP神经网络基本结构与现有紧凑型HFSWR浪高反演算法一样,本研究仍然选取回波多普勒谱中的一阶峰功率、二阶峰功率和RSB作为网络模型输入,由此确定输入层神经元个数为3.选取有效浪高作为网络模型输出,确定输出层神经元个数为1.依据经验,BP神经网络隐藏层层数选择为1层,即可有效训练回波参数与浪高的关系,节点选择依据经验公式有[12]p=m+n+q,(1)式中:p,m和n分别为隐藏层、输入层和输出层神经元个数;q为1~10的常数.通过实验比对,选择隐藏层神经元个数为6.另外,隐藏层激励函数为S型函数tansig,输出层激励函数为线性传递函数purelin.2.2 网络训练数据集网络训练的输入参数,采用2013年2月份(共28 d)于福建下垵采集的高频雷达探海实验数据.实验设备为武汉大学雷达与信号处理实验室研制的OSMAR-S[14-15]雷达,工作频率约13 MHz,接收天线采用单极子/交叉环天线[16],天线法向100°(正北方向起始,顺时针方向).根据回波参数提取情况,选定雷达覆盖区域:角度范围为60°~140°,其中角度分辨率为5°;距离范围为2.5~50 km,距离分辨率为2.5 km.由此雷达覆盖区域包含的网格单元数量为17×19=323.图2给出了实验海域的地理位置及周边浮标布置情况,雷达站名用XIAN表示,雷达覆盖区域用红线圈出,图中:A,B,C,D,G为浮标位置;N为纬度;E为经度.将2月份的雷达实验数据通过MUSIC估角的方式划分到各网格单元,对空间和时间维度上的坏值进行剔除,缺失值通过线性插值的方法补全,并根据浪场反演的时间分辨率0.5 h,将各网格单元的时间序列分成48×28=1 344组作为网络输入训练集.另外,由于实验期间,正多普勒频率区域的回波强度总体高于负频率,因此训练样本均是从正多普勒频率区域选择,这利于提高浪高反演的性能.10.13245/j.hust.210420.F002图2实验地理位置及周边浮标分布网络训练的输出参数是与输入训练数据对应时刻的有效浪高值.雷达覆盖区域包含323个网格单元,但该区域内的原位浮标仅有3站(A,C,G).为此,实验利用ECMWF (https://www.ecmwf.int)数据集的历史再分析有效浪高数据作为参考值.它可以提供原始空间分辨率为0.125°×0.125°、时间分辨率为6 h的浪高数据.实验中通过双线性插值的方法将数据处理成与输入数据对应的时空分辨率,并利用A浮标数据校准ECMWF数据获取校准因子.校准后的ECMWF数据与浮标A,C,G对应的浪高时间序列的相关系数和均方根误差精度可以达到很高[13],可以作为网络输出训练集.2.3 BP神经网络训练网络训练采用trainlm作为训练函数.通过信号在网络中前向传播、误差反向传播的方式,不断修正网络各层间的权值和阈值,直到达到目标最小误差.另外,在确定隐藏层神经元数量方面,依据式(1),优先选取最大数量的神经元.将输入训练数据预先进行归一化处理,并随机分成80%和20%两部分,分别作为训练集和测试集,前者用于训练网络参数,后者测试网络性能.实验前期由于隐藏层神经元数量选取过大,出现训练集拟合过好而测试集表现较差的过拟合现象.通过逐一减少隐藏层神经元数量,使得训练集和测试集性能表现逐渐接近;当数量过少时,测试集性能又呈现下降趋势.综合考虑,选用训练集和测试集性能最接近时的隐藏层神经元数量6作为最佳值.最后,在确定最终网络结构的情况下,将所有输入训练数据作为训练集,训练神经网络,当达到目标最小误差并保持相对稳定时结束训练,生成浪高反演网络模型.3 浪场反演结果将雷达回波参数输入网络模型,即可反演对应时刻的有效浪高场.利用2013年福建下垵高频雷达探海实验3月1~14日长达14 d的数据,验证浪高反演算法的精度和所训练网络的泛化能力.3.1 浪场反演结果和单点浪高的精度图3展示了3月2日6:00,3月4日23:30,3月8日17:30三个时刻雷达反演的浪场(分别对应高、中、低海况),用于验证本文算法在不同海况条件下浪场反演的稳定性.明显地,浪高在空间上保持平稳,三种海况下本文算法反演浪场与ECMWF所提供浪场间的均方根误差分别为0.36,0.25,0.28 m,表明浪场反演结果具有较好的稳定性.10.13245/j.hust.210420.F003图3不同海况下本文算法反演浪场(色标单位:m)将雷达反演的浪高与ECMWF所提供的浪高进行比对,以进一步分析本文算法反演浪高的性能.从边缘方位角近距离元、中心方位角中间距离元、边缘方位角远距离元,依次选取[方位角,距离元]为[140°,4],[100°,10],[70°,16]的3个网格单元(分别对应图3中的位置I,II,III),与ECMWF浪高时间序列进行比对.另外,基于RSB算法[9]反演的浪场被用于反演性能的对比,其中RSB与浪高之间的关系采用线性模型表示,该线性模型参数通过ECMWF浪高与雷达RSB最小二乘拟合获取.图4~6分别给出了3月份雷达反演浪高和ECMWF浪高间的时间序列、散点图、误差分布统计结果.图5中:H1为反演浪高;H2为ECMWF浪高.图6中:n为统计数量;H12为反演浪高与ECMWF浪高的差值.10.13245/j.hust.210420.F004图4有效浪高时间序列10.13245/j.hust.210420.F005图5有效浪高散点图10.13245/j.hust.210420.F006图6浪高误差分布统计结果由图4浪高的时间序列结果分析可以看出:三个位置处本文算法反演的浪高与ECMWF所提供的浪高时间序列间具有很高的一致性,其相关系数分别达到了0.95,0.97,0.92,均方根误差分别为0.32,0.29,0.41 m;采用RSB方法反演的浪高与ECMWF所提供的浪高间的相关系数分别为0.89,0.88,0.87,均方根误差分别为0.46,0.55,0.53 m.即本文算法在相关系数和均方根误差的指标方面优于RSB方法.另外,两种方法随着距离增加和方位角偏离法向,反演数据波动性都随之增大,而RSB方法的波动性要稍大于本文算法.此外,在海况较低的情况下,本文算法反演浪高的结果出现了明显的下限.主要原因是用于训练网络模型的2月份浪高数据下限的影响,通过比对发现训练数据的下限值普遍高于验证阶段的最低浪高值.从图5散点图的结果可以发现:在边缘方位角远距离元位置(位置III处),两种反演方法散点图的离散程度都增大,主要原因在于雷达回波数据一、二阶峰受距离衰减和方向扩展等因素的影响,相同海况下回波功率起伏性大.图中RSB方法反演结果的离散程度要大于本文算法.从图6误差统计结果发现:本文算法反演的浪高与ECMWF所提供的浪高时间序列间的误差主要集中在±0.4 m内,而RSB方法误差波动范围相对较大,这也说明本文算法可靠性更高.3.2 有效浪高场的精度为了反映实验中浪场反演的精度,通过将各网格单元的反演浪高时间序列一一同ECMWF所提供的浪高进行比较,计算了二者之间的相关系数和均方根误差.图7和8分别绘制了本文方法反演结果的相关系数与均方根误差的空间分布,另外,RSB算法的结果也被展示用于对比.本文算法在距雷达2.5~35 km的范围内(2~14距离元)反演效果很好,与ECMWF浪高数据的相关系数均在0.9以上,均方根误差在0.5 m以内;在35~50 km距离范围(15~20距离元)且靠近天线法向,相关系数和均方根10.13245/j.hust.210420.F007图7浪高时间相关系数空间分布误差也保持着较好的水平.统计了反演浪高与ECMWF浪高时间序列的相关系数和均方根误差.本文算法的总体相关系数分布在0.78~0.98之间(86%在0.9以上),均方根误差分布在0.21~0.80 m之间(66%在0.4 m以内),二者统计均值分别为0.93和0.38 m;RSB算法总体相关系数分布在0.54~0.92之间(仅有11%在0.9以上),均方根误差分布在0.37~1.44 m之间(仅有5%在0.4 m以内),二者统计均值分别为0.81和0.67 m.10.13245/j.hust.210420.F008图8浪高均方根误差空间分布(色标单位:m)值得注意的是:当远距离偏离法向时,精度会略微下降.分析产生上述现象的原因:一方面,较远距离的精度低于较近距离,主要原因是受到距离衰减因素的影响,信噪比起伏较大,信号估计准确性降低;另一方面,远距离偏离法向方向的精度低于法向,主要原因是信号在方位角偏离法向的情况下,总存在某一个环天线的天线增益在该方位角较小,信号估角准确性降低.图9给出了较远距离元RSB时间序列的标准差随角度变化的情况(浪高范围为1.1±0.25m),可以发现:在一定浪高范围内,不同距离元的数据波动性都呈现随方位角从法向到两端而逐渐增大的趋势.10.13245/j.hust.210420.F009图9不同距离元RSB时间序列标准差随方位角变化情况总体而言,本文算法相对于RSB方法拥有更高的反演精度和性能;但在远距离偏离法向的反演性能上,还有待进一步提升.4 结语本研究借助BP神经网络较强的学习归纳和非线性拟合能力,建立雷达回波参数一阶峰功率、二阶峰功率和RSB与有效浪高之间的映射关系,训练得到更加准确的关系模型.通过2013年福建下垵的雷达探海实验,利用2月份28 d的雷达数据和ECMWF浪高数据训练神经网络模型和拟合线性模型,利用3月1~14日14 d的数据检验模型性能.浪场反演结果表明:BP神经网络方法反演浪高与ECMWF浪高的总体相关系数分布在0.78~0.98,均方根误差分布在0.21~0.80 m,二者统计均值分别为0.93和0.38 m,性能优于现有方法.这说明采用BP神经网络方法提升了雷达回波参数与浪高关系模型的准确性,也表明BP神经网络在浪场反演方面具有较好的适用性.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读