0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于机器学习的水体化学需氧量高光谱反演模型对比研究

莱森光学 来源:莱森光学 作者:莱森光学 2023-03-23 09:58 次阅读

引言

化学需氧量(COD)是以化学方法测量水样中需要被氧化的还原性物质的量。水样在一定条件下的COD以氧化1升水样中还原性物质缩小化的氧化剂的量为指标,折算成每升水样全部被氧化后,需要的氧的毫克数,以mg·L-1来表示。COD测试可以很容易地量化水中有机物的含量。COD最常见的应用是量化地表水(如湖泊和河流)或废水中可氧化污染物的量,在水质监测中起到了巨大的作用。传统的有重铬酸盐滴定法和分光光度法等方法,电化学方法和流动注射分析法用于COD检测,但这些检测方法都存在检测周期较长、消耗试剂等缺点,对水体的批量检测也难以实现。

而利用高光谱技术和机器学习手段对水质参数进行反演近期已成为国内外热点研究问题。高光谱技术能够获得物体连续的光谱信息,近年来逐步应用于水农产品检测、生植被和水资源调控等领域。在水质参数高光谱反演建模中,国内外学者采取机器学习方法对不同水质参数进行建模,如总氮、总磷、水质浊度、一般悬浮物、化学需氧量等,并取得了一定成果。

实验部分

2.1 预处理

高光谱数据通常包含由相机或仪器产生的随机噪声和光谱变化。光谱预处理可以减少或消除数据中与自身性质无关的信息,降低模型的复杂性,提高数据和模型的可解释性(鲁棒性和准确性)。光谱数据的预处理在进行多变量分析之前是必不可少的。SG平滑能够使光谱曲线平滑,MSC方法能够消除基线漂移和平移现象。采用SG平滑、MSC以及SG平滑结合MSC光谱预处理手段对原始光谱进行预处理并进行比较。

2.2 特征波段提取

高光谱波段由大量的波段组成,有些波段的相关性较高而且存在冗余以及噪声等。对特征波段的提取在一定程度上可以规避这两种情况。

2.3 反演模型

选取线性回归、随机森林、AdaBoost、XGBoost四种机器学习建模方法。线性回归是一种确定两个或多个变量间相互依赖定量关系的机器学习方法;随机森林算法是决策树的集成,通过平均决策树可以大大降低过拟合的风险,是比单一决策树性能更优的模型;Adaboost是将弱学习器结合创造一个强学习器的机器学习方法;XGBoost是一种改进的梯度提升迭代决策树(GBDT)算法。

2.4 模型评估

采取RMSE,R²和RPD三个指标对反演模型进行对比和评价。

poYBAGQbsk-AVbcYAAAYqOGNwY4539.png

pYYBAGQbslCADJpQAAEiJNOykM4286.png

结果与讨论

3.1 原始光谱及数值统计分析

图1为样本水体的原始光谱曲线,水体在550~600nm的反射率较高,在700~750nm的反射率较低。从图中可以看出每个水体样本曲线的变化趋势类似,没有呈现较大的差异,而且难以直接通过光谱曲线对其COD含量进行判断。水体样本的COD值统计结果如表1所示。

poYBAGQbslCAFGPfAAMTZxrnSnY079.png

图1 水体样本原始光谱反射率曲线

表1 COD含量描述统计分析

poYBAGQbslGAVcV6AABLGBFGjAQ784.png

图 2 土壤样本去包络的反射率

3.2 光谱预处理结果

使用三种光谱预处理方法对原始光谱进行预处理,预处理后的光谱分布如图3(a,b,c)所示。经过光谱预处理后,高光谱的数据质量得到了一定改善,但还是无法直观的从光谱曲线上判断水体的COD含量,因此还需要通过机器学习方法对其建模进行分析。

pYYBAGQbslKAJHyYAAISudVvB8k574.png

图3 水体样本预处理后的光谱分布

3.3 反演模型

对原始光谱数据和三种不同的预处理方法分别使用四种机器学习模型建模。模型的反演精度与建模的训练时间如表2—表5所示。由表2—表5中数据可以看到,XGBoost在原始光谱以及三种经过预处理数据上的建模精度均优于其他模型,且训练时间小于随机森林模型以及Adaboost模型。线性回归所建的反演模型表现较差,说明COD与光谱数据并没有直接的线性关系。在所有的模型中,通过XGBooost对经过SG平滑和MSC处理的数据所建的反演模型精度最高,其中R2为0.92,RMSE为7.1mg·L-1,RPD为3.4。通过不同预处理方式所得的XGBoost反演模型散点图如图4(a—d)所示。

poYBAGQbslOAP6rqAAIjgyjr5Jg098.png

poYBAGQbslOAMuvyAALUrSWmnzM928.png

图4 不同预处理方法下XGBoost反演模型COD预测值与实测值关系散点图

结论

在实际生产过程中可根据实际需求,综合考虑模型精度、模型训练时间等因素进行模型的选择。研究结果表明,基于机器学习的高光谱COD反演模型精度可以达到较高水平,为机器学习在高光谱水质监测领域的应用提供了参考。此外,机器学习模型可解释性需要进一步研究。

欢迎关注公众号:莱森光学,了解更多光谱知识。

莱森光学(深圳)有限公司是一家提供光机电一体化集成解决方案的高科技公司,我们专注于光谱传感和光电应用系统的研发、生产和销售。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8367

    浏览量

    132357
  • 高光谱
    +关注

    关注

    0

    文章

    327

    浏览量

    9910
收藏 人收藏

    评论

    相关推荐

    光学知识水体COD光谱特性分析

    有机污染物是引起水体污染的主要原因,对水质、水中生物及生态平衡影响极为严重。由于有机污染物种类复杂,在水质评价中多采用综合性指标来表征有机污染的程度。化学需氧量(COD)便是评价水体
    的头像 发表于 04-12 10:40 1343次阅读
    光学知识<b class='flag-5'>水体</b>COD<b class='flag-5'>光谱</b>特性分析

    水体参数光谱反演模型对比研究

    引言 经济的发展提升了人们的生活水平,但有时会对环境造成严重而不可逆的影响,其中水污染尤其严重。对水体而言,最严重的问题就是氮磷的超标导致水体富营养化,导致水中营养元素过剩,引起水质恶化。因此
    的头像 发表于 04-17 16:47 1214次阅读
    <b class='flag-5'>水体</b>参数<b class='flag-5'>高</b><b class='flag-5'>光谱</b><b class='flag-5'>反演</b><b class='flag-5'>模型</b><b class='flag-5'>对比</b><b class='flag-5'>研究</b>

    部署基于嵌入的机器学习模型

    1、如何在生产中部署基于嵌入的机器学习模型  由于最近大量的研究机器学习
    发表于 11-02 15:09

    光谱传感器CASI与SASI支持下的水体精准提取_张东辉

    光谱传感器CASI与SASI支持下的水体精准提取_张东辉
    发表于 03-19 19:04 1次下载

    机器学习在遥感光谱图像中的应用

    为了克服遥感光谱图像中地面特征的自动化和智能化分类困难,在遥感成像过程中逐渐引入机器学习方法。研究人员提出了基于支持向量机(SVM)、极值
    的头像 发表于 10-16 15:43 5890次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>在遥感<b class='flag-5'>高</b><b class='flag-5'>光谱</b>图像中的应用

    机器学习中的无模型化学习算法及研究综述

    化学习( Reinforcement learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种
    发表于 04-08 11:41 11次下载
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>中的无<b class='flag-5'>模型</b>强<b class='flag-5'>化学习</b>算法及<b class='flag-5'>研究</b>综述

    模型化深度强化学习应用研究综述

    深度强化学习(DRL)作为机器学习的重要分攴,在 Alphago击败人类后受到了广泛关注。DRL以种试错机制与环境进行交互,并通过最大化累积奖赏最终得到最优策略。强化学习可分为无
    发表于 04-12 11:01 9次下载
    <b class='flag-5'>模型</b>化深度强<b class='flag-5'>化学习</b>应用<b class='flag-5'>研究</b>综述

    利用反射率、偏振度光谱特性进行叶绿素浓度反演

    对于内陆湖泊等二类水体,由于水体组成成分复杂,不同成分之间光谱特性的相互影响,使得单纯的利用反射率光谱进行遥感监测出现了信息量不足的情况,导致所建立的叶绿素浓度
    发表于 05-12 10:43 1689次阅读
    利用反射率、偏振度<b class='flag-5'>光谱</b>特性进行叶绿素浓度<b class='flag-5'>反演</b>

    光谱遥感技术在悬沙水体研究中的应用说明

    0引  言 水体中悬浮泥沙影响到水体的透明度和水色等光学性质, 还密切关系到河口海岸冲淤变化过程。采用光谱遥感技术获得悬沙水体的反射
    的头像 发表于 05-13 10:25 1347次阅读
    <b class='flag-5'>高</b><b class='flag-5'>光谱</b>遥感技术在悬沙<b class='flag-5'>水体</b><b class='flag-5'>研究</b>中的应用说明

    光谱遥感技术在地质领域的应用研究

    光谱遥感技术在地质领域的应用主要集中在地物分布反演方向。这一应用是基于提取光谱影像中不同地物在不同波段对电磁波的不同反射率特征,并与实验室测量已知矿物得到的参照
    的头像 发表于 05-17 10:16 2881次阅读

    手持式地物光谱仪对水体叶绿素的光谱特性测试研究

    为什么用地物光谱仪对地物进行测试? 对于地物的测试,传统的方法有化学法等。随着光谱学的发展,现在可以运用光谱法去对地物进行测试,获取地物自身的信息。无论是植被、土壤、
    的头像 发表于 07-03 15:51 1056次阅读
    手持式地物<b class='flag-5'>光谱</b>仪对<b class='flag-5'>水体</b>叶绿素的<b class='flag-5'>光谱</b>特性测试<b class='flag-5'>研究</b>

    机器学习与数据挖掘的对比与区别

    机器学习与数据挖掘的对比与区别  机器学习和数据挖掘是当前互联网行业中最热门的领域之一。虽然它们之间存在一些
    的头像 发表于 08-17 16:11 1454次阅读

    光谱技术估测烟草生化成分的机理和研究进展

    ,同时筛选出一些监测参数,并建立了相应的估算模型。烟草生化参数主要包括有:水分、色素、糖、N、P、K和微量元素等。在农业遥感信息模型研究、作物冠层光谱、叶片
    的头像 发表于 09-19 11:22 574次阅读
    <b class='flag-5'>高</b><b class='flag-5'>光谱</b>技术估测烟草生化成分的机理和<b class='flag-5'>研究</b>进展

    基于光谱的模拟壁画盐含量反演

    膨胀松弛,使得颜料表层出现酥碱、盐霜,甚至发展为起甲、 脱落病害,造成壁画的永久损伤。因此利用非接触式的光谱技术对壁画所含可溶性盐进行定量反演具有重要意义。
    的头像 发表于 11-06 17:52 445次阅读

    内陆水体藻蓝蛋白遥感反演研究进展

    生物化学生态系统的平衡。在内陆水体中浮游藻类,因其含有的色素可以捕获太阳光并将其转化成能量,充当着一切能量的提供者。有研究表明,色素组成及其比例的不同是引起藻类间吸收光谱变化的主要原因
    的头像 发表于 02-23 10:38 331次阅读
    内陆<b class='flag-5'>水体</b>藻蓝蛋白遥感<b class='flag-5'>反演</b><b class='flag-5'>研究</b>进展