人体通过呼气释放多种气体和挥发性有机化合物(VOCs)。这些化合物可用作肺部疾病(包括哮喘)的生物标志物。电子鼻(electronic nose)可以在诊断患者病情方面发挥作用。主要存在的问题是需要根据传感器的特性和性能选择合适的传感器来检测各种类型的气体,以提供最佳的系统,同时仍能提供高精度。遗传算法在应用特征选择问题方面具有很好的优势,可以通过交叉、变异和选择三个主要遗传算子有效解决噪声和共线性问题。
据麦姆斯咨询报道,近日,印度尼西亚泗水理工大学(ITS)的研究人员组成的团队在IEEE Access期刊上发表了题为“Optimization of the Electronic Nose Sensor Array for Asthma Detection Based on Genetic Algorithm”的论文。本项研究工作旨在应用遗传算法来确定气体传感器的最佳数量,以通过呼气来识别健康人群和疑似哮喘患者。研究人员将支持向量机(SVM)、随机森林(RF)、极端梯度提升(XGBoost)、人工神经网络(ANN)、一维卷积神经网络(1D-CNN)、长短期记忆(LSTM)、门控循环单元(GRU)、1D CNN-LSTM和1D CNN-GRU等多种分类方法与选定的气体传感器阵列相结合,以获得优化的电子鼻系统。实验结果表明,遗传算法能够提供五个气体传感器,并为疑似哮喘患者呼出的气体提供特定的传感器模式。1D-CNN模型被选择作为哮喘数据集的分类方法,其准确率为96.6%,精确度为96.1%,召回率为95.5%,F1分数为95.6%。
这项研究提出的设计如图1所示。第一步是让所有志愿者提供装在1L(升)Tedlar袋中的测试样本,所有受试者,包括健康和疑似哮喘患者,都由医院的肺部专家进行了诊断。一种由七个气体传感器、一个腔室和一个电动泵构成的电子鼻已被开发并被用作测试装置。所有电子元件均安装在印刷电路板(PCB)上,以减少电路和环境噪声。该仪器配备了神经网络模式识别算法。为获得最佳的神经网络模型,需要对各种配置进行测试和评估。传感器信号的标准化和特征提取被用于表示分成三个数据集的样本特征,包括二元和多元数据集。利用最优神经网络模型在三个数据集中对所有传感器组进行测试。每个数据集都提供了基于高精度值的最佳传感器。最后一步是使用支持SVM、随机森林(RF)、极端梯度提升(XGBoost)、人工神经网络(ANN)、一维卷积神经网络(1D-CNN)、长短期记忆(LSTM)、门控循环单元(GRU)、1D CNN-LSTM和1D CNN-GRU等不同分类模型测试三个数据集上的主要传感器。模型评估包括准确率、精确度、召回率和F1分数。
图1 本项研究工作提出的方法
本项研究中使用的电子鼻系统由气体传感器阵列、微控制器和计算机构成(如图2所示)。在这种情况下,一种金属氧化物气体传感器被用于记录呼出的气体。使用金属氧化物半导体作为气敏材料的优点包括性能稳定、成本低、使用简单、使用寿命长、响应时间短、对呼出气体标记物的灵敏度高等。
图2 实验中使用的电子鼻
先前的研究已将SVM模型应用于多种场景,包括区分健康人群与疑似哮喘患者,以及对不同严重程度的哮喘进行分类。获得的最高结果准确率为89.5%。然而,这些结果仍然可以通过改变模型参数来改善。该方法采用网格搜索交叉验证(Grid-SearchCV)技术,被称为超参数优化。该模块是scikit-learn的一部分,scikit-learn是Python编程语言的软件机器学习库,它可以帮助确定基于最高精度的最佳模型参数。在本研究中,SVM、RF、GridSearchCV和遗传算法来自scikit-learn库,而ANN、1D-CNN、LSTM和GRU来自Keras库。
遗传算法基于变异、交叉、选择等遗传进化产生优化的解决方案。在本研究中,基于其适应度值,遗传算法被用于评估和排除气体传感器。该方法将支持向量机(SVM)作为适应度函数。确定SVM模型参数的技术如图3所示。
图3 SVM作为遗传算法的适应度函数
图4描述了使用遗传算法的传感器选择过程。
图4 遗传算法流程示意图
哮喘类别涉及三种不同的严重程度,包括控制性哮喘、部分控制性哮喘和未控制性哮喘。所有这些类别都是根据ACT分数来标记的。每种类型的哮喘由10名受试者组成。因此,所有数据集都可分为二元和多元类。二元类由健康人群和哮喘患者数据集组成。多元类由健康人群和不同严重程度的哮喘患者数据集组成。每种类别的气体传感器响应示例如图5所示。每种类别都有特定的传感器响应曲线。
图5 气体传感器对(a)健康人群、(b)控制性哮喘、(c)部分控制性哮喘和(d)未控制性哮喘患者呼出的气体的响应
接下来,研究人员进行了分类模型的优化研究。
综上所述,本研究应用电子鼻方法对健康人群和不同严重程度的疑似哮喘患者进行了分类。电子鼻系统涉及由七个气体传感器构成的传感器阵列。同时,利用遗传算法确定以SVM模型为其适应度函数的传感器的最优数量。不同的分类模型被用于评估所选传感器的性能。实验结果表明,遗传算法可以提供五个气体传感器,即MQ-8、MQ-136、MQ-137、MQ-138和TGS4161,并对疑似哮喘患者呼出的气体产生特定的传感器模式。在分类方面,1D-CNN、LSTM和1D CNN-LSTM模型的准确率至少为96%。1D-CNN模型被首选作为哮喘数据集的分类器,其准确度高达96.6%,精确度为96.1%,召回率为95.5%,F1分数为95.6%,并且训练时间最短。提出的原型的尺寸仍然很大,包括一个传感器腔室和一台计算机。在未来的研究中,研究人员将减小传感器腔室的尺寸,以加速气体传感器的响应。此外,分类模型将在单个板载计算机上实现,以提供紧凑且便携的电子鼻系统。
论文信息:
doi: 10.1109/ACCESS.2023.3291451