睡眠在日常生活中是不可缺少的一环,晚上充足的睡眠有助于保护心理健康、身体健康和生活质量.睡眠的筛查和分析是评估睡眠相关疾病的重要工具,如睡眠呼吸暂停.每个睡眠阶段都有自己的特点,为了诊断睡眠问题,通常从患者身上采集包括脑电图(EEG)、眼电图(EOG)和肌电图(EMG)在内的整夜多导睡眠图记录.睡眠结构和睡眠质量可以用睡眠阶段来表示.睡眠阶段通常包括夜间清醒(W)阶段、快速眼动(R)阶段和非快速眼动(NREM)阶段.根据美国睡眠医学学会(AASM)分期标准[1],NREM阶段可以进一步分为N1,N2和N3阶段,总计包括W,N1,N2,N3和R五个阶段.由于专家手动对不同的睡眠阶段进行区分的工作量十分巨大,因此为了缓解受试者的压力和节省医疗资源,许多研究试图基于EEG信号自动对睡眠阶段进行分期.这些研究方法主要分为传统机器学习方法和深度学习方法.传统的机器学习方法基于时域特征、频域特征、时频特征及非线性特征[2-3],通过不同的分类器来对睡眠进行分类,如支持向量机(SVM)、随机森林(RF)和BP神经网络.这些特征通常具有明显的物理意义,文献[4]将EEG信号分解成八个频段,从每个频段中提取13个特征,由随机森林进行分类,达到了较好的效果.文献[5]基于近似熵、样本熵、多尺度熵等各种特征,利用神经网络(ANN)进行分类,达到了80%的分类准确率.文献[6]基于Hjorth参数、小波变换等特征,使用SVM分类器进行分类,然后采用堆叠顺序学习来提高系统性能,获得的准确率可达80.07%.近年来,深度学习方法在许多研究方向上取得了巨大成功,例如卷积神经网络[7](CNN)在特征提取方面表现出强大的效果,递归神经网络[8] (RNN)和长短期记忆网络[9](LSTM)已被证明在时间序列信号处理方面具有良好的能力.因此,许多研究试图使用深度学习方法来处理人工提取的特征以提高模型的可解释性.文献[10]利用整流神经网络从人工制作的特征中检测层次特征,然后使用长短期记忆网络(LSTM)学习序列信息,以提高EEG和EOG信号的分类性能.文献[11]提出一种基于注意力的深度学习架构,基于MRCNN提取EEG信号的低频和高频特征,利用多头注意力机制来捕捉提取的特征之间的时间相关性,分类准确率达到了85.6%.这些研究证明了人工提取的特征在神经网络上进行睡眠分期的可行性.本研究针对睡眠分期的关键问题展开了探索,利用复合多尺度排列熵、样本熵等特征进行训练,有效提升了分类准确率.然而,由于睡眠样本中各睡眠阶段分布不均衡,尤其是N1阶段样本较少且易与其他阶段混淆,分类难度较大.为解决此问题,本研究采用ADASYN算法实现了样本类平衡,并设计了双层睡眠分期模型,将五分类问题转化为两个三分类问题,显著降低了易混淆睡眠阶段的分类难度.双层模型由第一层模型RF[12]与第二层模型基于遗传算法的BP神经网络[13](GA-BP)组成.该模型在健康受试者中取得了较高的分类准确率,尤其在N1阶段的识别能力方面表现突出,为睡眠分期的精准识别提供了有效手段.1 实验数据与方法1.1 数据集本研究使用PhysioNet公开的Sleep-EDF Database Expanded的数据集(以下简称Sleep-EDF),是Sleep-EDF Database的大幅扩展版本.此数据库包含EEG,EOG和下巴EMG图,以30 s为周期进行睡眠阶段的专家注释[14],一些记录还包含呼吸和体温.本研究选取了此数据集中的10名健康受试者,且10名被试都有完整的夜间记录.每个完整的记录包含2个脑电图通道(Fpz-Cz和Pz-Cz),采用Fpz-Cz通道的脑电图,采样频率为100 Hz.数据集中睡眠专家根据R&K标准,将这些记录手动分为6个类别(W,N1,N2,N3,N4和R).本研究根据最新的睡眠分期标准AASM标准,将N3和N4一起合并到N3中以匹配最新的AASM标准.1.2 预处理及类平衡首先将整晚的EEG信号化为30 s一段的睡眠样本与专家评定的规则保持一致.主要的预处理流程包括伪迹去除及0.5~30 Hz带通滤波等.图1为本研究模型的流程图.10.13245/j.hust.240370.F001图1本研究模型的流程图睡眠阶段具有不同的样本分布.表1中总结了Sleep-EDF数据集中五个睡眠阶段的样本数量和占比.N1阶段的样本数占比最少,仅有4%,且其余四个睡眠阶段的样本分布也不平衡.样本类的不平衡会导致模型有偏向的学习,使模型的分类准确率下降,本研究采用ADASYN[15]算法对不平衡数据集进行重采样,构建类平衡的睡眠数据集以进行模型的训练.10.13245/j.hust.240370.T001表1各睡眠阶段样本占比睡眠阶段样本数量占比/%W6 00044N15644N24 17831N31 1869R1 64212ADASYN算法通过自适应生成合成样本以减少类不平衡带来的偏差.ADASYN算法通过少数样本和多数样本之间的比例来计算少数样本的总数,多数类的优势决定了使用KNN原则从每个少数类样本中生成合成样本数量,从而达到使睡眠数据类平衡,减少类不平衡带来的偏差.图2为睡眠阶段R的生成电压信号与原始电压信号对比.10.13245/j.hust.240370.F002图2睡眠阶段R的生成电压信号与原始电压信号对比1.3 特征提取复合多尺度排列熵(CMPE)是常用的复杂度指标,对时间序列采取了复合粗粒化的方式进行了划分,最大限度地保留了EEG信号时间序列xi中的状态信息.CMPE的定义为yk,j(s)=1s∑(j-1)s+kjsxi    (1≤j≤N/s,1≤k≤s);ACMPE(N,s,m,λ)=1s∑k=1sAPE(yk(s),m,λ),式中:yk, j(s)为尺度因子s下的第k个粗粒化序列;j为yk(s)的第j个点;ACMPE为CMPE的值;APE为排列熵(PE)的值;N为指样本信号序列长度;m为指嵌入维数;s为尺度因子;λ为延迟时间.本研究分别计算多尺度排列熵(MPE)和CMPE在相同尺度因子上排列熵的值AMPE和ACMPE,比较这两种方法对不同睡眠阶段的敏感程度.由图3可知:在相同尺度因子下,CMPE值比MPE的值变化平稳,波动幅度小,且更平滑,对比可知CMPE对信号计算效果更好.从不同睡眠阶段EEG信号各个尺度因子的MPE和CMPE值可以看出:不同睡眠状态下的MPE和CMPE值各不相同,不同睡眠阶段随着尺度因子的增加,熵值呈下降的趋势.当尺度因子为1时,除W期熵值较高外,其余四期熵值偏低.若尺度因子超过10,则N1,N2,N3和R期的值将开始重叠,并且熵值随着尺度因子的增加而呈下降趋势,且熵值堆叠的越严重,导致计算出的熵值无法作为特征值.另一方面,不建议尺度因子过大,因为会引起不必要的计算和影响计算效率.若尺度因子为1~10,则CMPE熵值下降幅度更明显.这表明尺度因子对熵值的计算影响很大.根据不同睡眠阶段的相同尺度因子计算得出的熵值具有相对明显的差异,表明CMPE被用作睡眠分期特征的可行性.本研究中取m=6,s=10,λ=1.10.13245/j.hust.240370.F003图3相同尺度因子下的ACMPE和AMPE本研究还提取了一些其他特征,如Petrosian分形维数、样本熵、近似熵、LZ复杂度、过零点率、峰度、信号中最大最小值和不同频段(0~4,4~8,8~12,12~15,15~22,22~30 Hz)中信号的能量.1.4 双层分类模型1.4.1 随机森林随机森林(RF)是一种集成学习方法,用于监督学习中的分类和回归任务,它在训练中构建多棵决策树,并选择不同的叶子数,从树集合投票中选出输出的类.在设置特征数量后,测量并绘出样本在不同数量决策树和叶子数下RF训练中的分类误差,图4所示为分类误差曲线,图中:决策树的最佳数量为53;叶子数最佳数量为1.10.13245/j.hust.240370.F004图4分类误差与RF中生长的决策树和叶子数量关系1.4.2 基于遗传算法的BP神经网络EEG信号是非线性的信号数据.为了解决易混淆睡眠阶段分类错误率低的问题,考虑了一种反向传播神经网络(BPNN)算法.然而,BP神经网络模型基于梯度搜索技术来确定其权重,该技术在学习过程中很容易陷入局部极小值,并且对权重初始化.遗传算法(GA)是一种全局优化算法,能够在复杂、多峰、不可微的向量空间中找到全局最优解.利用遗传算法搜索BP神经网络模型的初始权重可以保证获得全局最优值的概率相对较高.因此,本研究考虑了一种基于遗传算法的BP神经网络来克服BP神经网络的不足,通过全局优化,提高收敛速度,且能够在处理高维和非线性数据时具有鲁棒性,有效地训练网络并提升泛化性能.然后通过选择、交叉和变异产生最优个体,并产生最优权重.将最优权重输入到BP神经网络中进行训练,BP神经网络的节点数选择为10.同样在设置特征数量后,测量并绘制Sleep-EDF样本在不同的种群规模和遗传代数下,GA-BP分类的分类准确率,如图5所示,GA-BP中迭代次数的最佳数量为53,种群规模最佳数量为6.10.13245/j.hust.240370.F005图5分类准确率与GA-BP中种群规模和迭代次数的关系1.4.3 双层分类模型结构由于传统睡眠分期N1阶段的准确率多在57%~60%,本研究提出的双层分类模型将五分类问题转化为两个三分类问题,具体分类过程如图6所示.10.13245/j.hust.240370.F006图6双层模型流程图双层分类模型由RF和GA-BP组成,第一层由RF进行分类,将五个睡眠阶段中的N1,N3和R三个分类易混淆的睡眠阶段在进行第一层分类时并为一类,与W和N2两个睡眠阶段一起输入到分类器中进行训练,对样本进行bootstrap抽样,即有放回的抽样本,获得m个训练集,再经过m棵决策树(tree)训练后,获得m个分类结果(class),最后通过投票法取得最优结果.由第一层的分类结果,将分类正确的N1,N3和R三个睡眠阶段再单独取出,作为三分类问题再输入到第二层分类模型GA-BP中,过程包括神经网络结构的选择、权值的优化和网络的反演,在优化过程中,将权值视为遗传算法中的个体,个体的适应度值是由个体初始化的BPNN的预测误差,然后通过种群选择、交叉和突变得到最优个体,即最优权重,再将最优权重输入到BP神经网络中进行训练,并得到N1,N3和R的分类准确率,最后计算各阶段分类正确样本在其样本总数的占比.1.5 模型评价指标本研究用四个指标来评估所提出的双层睡眠分期模型的性能,分别为分类的准确率、精确率、召回率和模型精确度指标F1分数.准确率是指正确分类的样本数量与总样本数量的比率;精确率是指模型中在预测为正类的样本中,真正为正类的样本数量与预测为正类的样本数量的比率;召回率是指模型在所有正类样本中,成功预测为正类的样本数量与真正为正类的样本数量的比率;F1分数是精确率和召回率的调和平均数,它将精确率和召回率结合到一个单一的度量值中,用于衡量分类器的综合性能.2 实验结果与对比2.1 实验设计本实验使用Sleep-EDF数据集中的单导脑电信号(Fpz-Cz通道)训练和评估所提出的模型,将提取到的特征输入到双层分类模型当中,随机的提出每个睡眠阶段的20%作为测试集,为了避免结果的偶然性,共进行10次训练,取10次训练后的平均值作为结果.通过对原始EEG信号进行处理和特征提取,将所提取的特征参数输入到RF和GA-BP模型中进行睡眠分期;随后将分期结果与专家标记结果进行对比,以得出模型的性能指标,验证睡眠分期模型的有效性.2.2 实验结果本研究计算了双层分类模型每个睡眠阶段的精确率、召回率和F1分数,见表2和表3.在第一层分类模型中对于W,FS和N2的识别,其最差F1分数在N2阶段为0.869.在第二层分类模型中,由于是对易混淆的N1,N3和R睡眠阶段进行分类,因此总体性能与第一层分类模型有一定差距,最差的出现在N1阶段的分类中,F1分数为0.790.由于训练样本较其他睡眠阶段的样本数量少且易与其他睡眠阶段混淆,因此N1阶段是五个类别中最不易识别的,从总体样本来看,N1阶段分类正确个数在N1阶段样本总数的占比达到了69.5%,有显著提升,如表4所示.10.13245/j.hust.240370.T002表2第一层模型分类的性能指标睡眠阶段精确率/%召回率/%F1分数W97.796.70.972FS91.194.40.927N290.084.00.86910.13245/j.hust.240370.T003表3第二层模型分类的性能指标睡眠阶段精确率/%召回率/%F1分数N184.084.00.790N397.997.40.977R82.490.00.86110.13245/j.hust.240370.T004表4各模型准确率对比模型通道选择数据集准确率/%每个睡眠阶段的准确率/%WN1N2N3R文献[16]Fpz-Czpublic dataset79.081.959.877.988.879.9文献[11]Fpz-CzSleep-EDF84.489.742.688.890.279.0文献[10]F4-EOGpublic dataset85.984.656.390.784.886.1文献[17]Fpz-CzSleep-EDF87.190.356.689.389.986.5本研究Fpz-CzSleep-EDF88.396.869.584.093.185.82.3 实验结果对比将本研究所搭建的双层模型与机器学习和深度学习算法进行比较[10-11,16-17],从表4中可以看出:本研究所提出的模型对健康受试者的准确率可达到88.3%,较对比模型提高1%~3%,其中N1阶段的分类准确率可达69.5%,较以往模型提高约10%,有显著提升.总之,本研究在单通道脑电图自动睡眠分期方面表现出了更好的性能.3 结语本研究提出一种基于RF-GA-BP的双层分类模型用于睡眠阶段分类,将五分类问题转化为两个三分类问题,有效利用复合多尺度排列熵、样本熵、不同频段的能量值等一系列能够反映不同睡眠阶段信息的特征进行训练.首先对于睡眠数据样本类别的不平衡,使用ADASYN算法生成合成样本以减少类不平衡带来的偏差;然后在经过信号的预处理后,提取睡眠样本在不同域的10个特征及非线性特征.实验结果表明:本研究提出的双层分类模型对N1期和模型整体的分类准确率有较大提升,N1期准确率的上升将对觉醒-入睡阶段转换的识别更为敏感,有望在疲劳驾驶领域和失眠综合征领域提供帮助.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读