当前位置: 巴西 >> 地形地貌 >> 基于专家的地图和高度详细的地表排水模型,
学术简报
题目:Expert-basedmapsandhighlydetailedsurfacedrainagemodelstosupportdigitalsoilmapping
作者:FellipeA.O.Mello,Jos′eA.M.Dematt?e,RodneiRizzo,Andr′eC.Dotto,RaulR.Poppiel,WandersondeS.Mendes,Cl′eciaC.B.Guimar?aes
期刊:Geoderma/
01
摘要
土壤图是农业规划和土地管理的重要工具。数字技术已用于创建土壤图。但是,大多数研究并未探索与土壤变异性有关的预测模型的排水网络(DN)信息。因此,本研究旨在评估DN对使用数字土壤测绘技术预测土壤类别的贡献。我们使用了常规的土壤分类图(1:20,)和环境变量,创建一个分辨率为30×30m的点网格,以提取土壤和变量信息。我们使用这些数据来校准随机森林模型,并通过交叉验证来优化模型选择。根据世界参考库(WRB)土壤分类系统,在53,公顷研究区域的预测土壤类别中分为两个级别。第一级仅考虑土壤组,而第二级考虑土壤组和限定剂。我们使用其他常规土壤图(内部验证)和现场采样点(外部验证)验证了这些图。推断土壤图后,我们使用现场观察验证了模型的性能。在这种情况下,该方法对土壤的第一层的精度为0.56,kappa为0.31,对于第二层的,精度为0.38和0.25。Regosols和Cambisols的预测被低估了,从而降低了验证的准确性和kappa结果。但是,Ferralsols达到了准确度,而Acrisols达到了约70%的准确度。与排水相关的属性对模型的性能贡献最大(准确性=56%),并改善了土壤图的推断。
02
研究内容
简介
数字土壤测绘(DSM)的定义是使用田间土壤样本,隐性知识以及相关的景观变量的定量模型在空间和时间上推断土壤的属性和/或属性。航道的空间布置在一定程度上指示了土壤的分布,但是详细的DN数据如何改善DSM仍存在差距。在这项研究中,我们将详细的排水信息结合到使用1:20,常规土壤图训练的预测模型中,然后将其外推到整个研究区域。我们的假设是,包含有关DN的详细信息的地形属性将增强DSM性能。当兴趣区域中没有土壤信息时,外推法是替代方法。该方法基于使用环境变量(例如,地形属性,卫星图像)和土壤变量(例如,土壤类别,属性或近端土壤感测数据)对模型进行的校准。最后,该模型用于预测较大区域内特定类型的土壤信息。确立以下目标:(a)使用代表土壤类别的传统土壤图(比例为1:20,),根据地形属性和卫星数据校准分类模型;(b)根据世界参考库(WRB)的土壤分类(IUSS工作组,年)对覆盖研究区域的土壤类别进行空间预测,并生成第二级的土壤分类图;(c)使用内部和外部土壤观测来验证地图,并评估模型的性能。该方法旨在低成本,环境清洁,无损,可重复和可重现。研究区域
巴西东南部圣保罗州内的53,公顷(图1)。该地区属热带气候,属于亚热带湿润气候,夏季潮湿,冬季干燥,并根据养护管理措施用于种植甘蔗。该地区的地貌变化范围在海拔至m之间(图1),并覆盖了由复杂的地质构造形成的大量不同的土壤类别。这些地层包括火成岩,变质岩和沉积岩,它们在热带条件下遭受强烈的风化作用
土壤数据
根据WRB使用常规的土壤调查和制图方法对研究区中的七个甘蔗生产农场(图1)进行了测绘(表1)。实地考察在研究区域内提供了个采样点,并将收集到的样本提交给土壤的理化分析分类。最终产品是没有土壤联系的1:20,比例的土壤分类图(图1)。土壤分类图被用作主要数据,以对数字土壤图模型进行校准和内部验证(图2b)。我们选择了四个代表性农场(2、3、4和6),占该地区可用的常规土壤图的70%。这些农场用于校准随机森林模型(RF),并将土壤图外推到更大的区域(图2a)。
图1研究区域在七个农场,个土壤点和专家以1:20,比例绘制的常规土壤图来研究区域位置。世界参考库-WRB将土壤图和点分类为第二类。
图2方法流程图
a.工作中使用的数据库,其中包含土壤信息和三个环境变量数据集;
b.创建规则的点网格(30x30m),以提取土壤类别和环境变量;
c.应用随机森林和交叉验证来定义协变量的最佳集合,以预测直到第二分类级别的土壤类别;
e.在验证农场上创建点的规则网格(30x30m),以提取常规和预测的土壤类别并执行内部验证,例如比较实地收集的预测类别和土壤类别以进行外部验证。
03
详细的景观属性
计算环境变量,作土壤形成因子代表,用于绘制研究区土壤类别的空间分布图。
2.1救济属性
我们从IGC获得从1:40比例尺的平面时图获得的五米等距轮廓线。这些线用于在ESRIArcGIS10.4中使用“地形到栅格”功能对DEM进行插值。使用SAGAGIS软件中的TerrainAnalysisLibrary,将得到的DEM用作输入以计算六个地形属性。
2.2排水网络属性
基于对1m分辨率航拍图像的立体分析来创建更详细的排水信息。从EMPLASA获得了数字格式的航拍图像,图像是用数码相机在一架飞机上以1m的空间分辨率捕获的,以1:10,的比例生成8位RGB图像。使用线密度工具在ESRIArcGIS10.4中计算了排水密度(DD)属性。我们遵循通道长度之和(km)除以流域面积(km2)。排水相关属性对于补充景观特征非常重要,因为它们可能与土壤类别的短程空间格局相关。
2.3来自SRTM的景观属性
大规模的信息可能并不意味着更好的预测性能。因此,还使用全球分辨率为1弧秒的航天飞机雷达地形任务(SRTM)计算了相同属性SRTM的高程数据分辨率为30米,是免费可靠的数据来计算地形属性,许多DSM工程已经使用了该数据。将两个数据集用于DSM,以比较土壤分类预测的效果(图2c)。
2.4裸露的土壤图像组成
表土模式与土壤剖面中发生的地下变化和动态过程有关,这些变化和变化过程特定于每种土壤类别。使用GoogleEarthEngine(GEE)将地理空间土壤传感系统(GEOS3)应用于Landsat图像的时间序列。使用裸露的土壤像素逐个像素地计算单波段表层土反射率的中值并获得最终反射率值。SySI具有从30m分辨率的蓝色到短波红外区域的六个光谱带(图2a)。为了在气候条件和土壤分布不同的地区使用SySI,必须解决这些限制。在这项工作中,我们能够在农业现场使用SySI,并在其他工作中测试了已建立的阈值。
2.5建模技巧
在这项研究中,我们使用了RF机器学习算法,这是一种适用于DSM作品的常用工具,并且产生了良好的效果。一些处理土壤清单的工作采用了其他建模技术,例如聚类算法和称为DSMART的地图分解方法。但是,这些工作的重点是在土壤图边界内的比例尺增强,而我们将1:20,的常规土壤图外推到更大的区域。
2.6随机森林和自举
使用bootstrap方法作为插入符号包中的火车控件来执行模型(图2c)。引导程序是一种数据重采样方法,用于估计未知分布的统计参数。要访问模型拟合并优化模型选择,我们使用了一组调整参数,如下所示:随机选择的预测变量数(mtry)(设置为3),树的数量(设置为),每个变量尝试的变量数分割(设置为2)和引导重复的次数(设置为25)。根据准确度和kappa系数选择最佳模型。我们使用这些参数来设置三个数据集之间的最佳组合。通过基尼系数的平均下降来分析每个变量的贡献,并将该模型应用于预测第一和第二分类级别的土壤分类图(图2c)。
2.7模型校准
四个农场(2、3、4和6)中的常规土壤图(1:20,)来校准RF模型(图2a)。常规土壤图是根据WRB土壤分类系统创建的。土壤分类达到了第二类,代表了土壤的分类及其颜色(图1)。我们使用土壤类别作为模型中的因变量来生成两个最终图:i)第一个分类级别(即Ferralsols);ii)第二类等级(即RhodicFerralsols)。我们在校准农场上创建了一个30×30m的点网格(图2b),以从三个数据集中提取土壤类别和环境变量(图2b)。一个校准集,代表了70%的映射区域。我们使用数据集和属性(救济和排水)的不同组合测试了RF模型,以检索最佳模型(图2c)。我们能够通过引导程序,准确性,kappa系数和mtry值选择最佳模型。最后,我们将模型应用于整个研究区域的土壤分类。
2.8预测地图和模型验证
将地图外推到研究区域后,我们进行了两次验证以评估地图的质量(图2)。我们进行了内部验证,还对预测图进行了外部验证(图2e)。
04
结论和讨论
3.1评估模型预测
我们比较了数据集在预测WRB第二分类级别之前的土壤类别的潜力(图3a,b)。土壤第一和第二分类级别具有更高的准确性和kappa系数。这证明了使用详细信息识别复杂土壤变异的重要性。当因变量是土壤的第二类水平时,校准测试还显示出较低的准确性和卡伯系数(图3a,b)。强调了使用质量数据改善土壤清单的重要性。评估了SySI的性能,作为代表Landsat时间序列的裸土反射率的环境变量。与救济和排水相比,仅SySI模型的性能令人满意(图3a,b)。但是,添加SySI以及其他属性可以提高最终模型的准确性和kappa系数,从而证实了其区分土壤单位和属性的潜力。通过引导分析和模型的性能(准确性,kappa和mtry)选择了最终模型。最好的模型是数据集1和3组合的结果(图3a,b)。因此,我们继续使用该模型在第一和第二分类级别上推断土壤图。
图3使用引导程序作为重采样方法的随机林的校准结果。不同的数据集组合可用于预测WRB第二类级别的土壤类别。a.土壤冷杉分类水平的准确性和kappa系数结果;b.第二分类等级的精度和kappa系数。
3.2在随机森林模型中环境变量的权重
选择最佳模型之后,我们在两个分类级别上分析了变量在预测土壤类别中的重要性(图4a,b)。贡献较大的变量是水平陆上水流距离(HOFD)和DD。此外,与起伏和SySI相比,与排水相关的属性具有更高的贡献,与排水相关的属性比起缓解属性对模型准确性的贡献更大(图4a,b)。通道网络就像土壤一样,是对气候,地质和地貌相互作用的响应,其模式表明了景观的不连续性和地下含量。然而,将这种水文知识整合到土壤测绘中的尝试是定性的,并且依赖于默认的知识。排水和救济相关属性之间的比较有助于定量评估DN模式如何以自动化方式帮助土壤测绘仪。使用详细的DN信息对于正确表示土壤变化至关重要。我们可以使用分形维数属性为每个农场设置适当的DN比例,但是我们认为这是不必要的,因为农场的面积相似并且可以代表研究区域。
图4平均减少基尼系数图表显示变量在随机森林建模中的重要性。a.表示土壤一阶分类的变量重要性的图形;b.变量重要性的图形表示最多二阶土壤。
3.3土壤图外推
我们在整个研究区域以1:20,的比例外推了常规土壤图(图5)。预测的土壤图对应于WRB第一类,代表土壤组(图5a)和第二类,代表与土壤颜色相关的土壤组和限定物(图5b)。评估该模型在预测5个类别的较简单土壤变化和8个类别的较复杂土壤变化方面的性能。该策略有助于评估环境属性可以很好地识别土壤过渡的能力。渗透性地下物质比表面径流更有利于渗透。这会刺激成岩活动,例如物质的重新分布,易位,增加和损失。在这些稳定的区域,DN通常不会扩展,几乎没有形成通道。它们与母体的紧密接触降低了入渗速率,有利于渠道网络的形成并减缓了土壤的形成过程。
图5研究区域的土壤图外推。土壤分类根据WRB土壤分类系统进行。a.包含WRB土壤组的土壤图(第一级);b.包含WRB土壤组和限定词(第二层)的土壤图。
3.4内部验证
第一类级别我们将外推图与农场1、5和7的常规土壤图进行了比较。根据WRB土壤,使用了这些农场上的点网格(图2d)提取了第二类级别的土壤类别。我们通过土壤-景观关系并通过混淆矩阵分析了预测的地图。传统地图上的总体土壤格局分布是山顶处的Ferralsols,其次是较低位置的Acrisols,以及坡地上的Cambisols(图6a)。坎贝索尔和钩藤溶胶被绘制在靠近肩膀和后坡的景观位置(图6d),通常在野外发现。校准场(5和7)对土壤分配有更多的概括(图7)。关于土壤第一类分类的混淆矩阵显示坎比索尔和尼蒂索尔分别具有18%和24%的UA(表3)。这些土壤在景观上具有相似的形成过程和位置。
图6根据WRB土壤分类对土壤进行数字土壤制图。通过随机森林算法改进了土壤制图上的突出区域。圆圈中的图表示DN的重量和分离土壤的起伏。a)常规土壤图;b)DSM;c)更好地适应尼替洛尔;d)地形,较高的DD和Cambisol的分配;e)滴灌剂位于高DD的山坡上。
图7用于校准场5和7的类的数字土壤映射。分析从随机森林机器学习算法中检索到的一般性和良好性能。a)对Acrisol进行了数字映射,而不是Cx,Lp和Ni;b)坎比索斯被放置在高DD区域;c)用阿克雷索尔代替铁醛。
图8根据WRB土壤分类,使用策略2对类别进行数字土壤制图。DSM会以横向视图突出显示。这些图表示预测的类别与景观和DN模式之间的关联程度。a,b和c分别是农场1、5和7的常规土壤图;d山顶位置和崎terrain地形之间的土壤差异;e过度安装Acrisol;f用RhodicAcrisols代替RhodicFerralsols
第二分类层次推断复杂土壤图的尝试具有挑战性,这是重要的是要使用代表土壤变化的数据作为自变量。然而,图8显示,土壤是根据土壤与景观的关系正确分配的。可以了解排水相关属性对C,N和Lp类的预测的贡献。随着母体材料的变化,河道的格局从上到下变化,因此代表了土壤的变化。预测地图上更多的类别表明,与传统方法相比,该模型能够识别更多的地形变化。
应用点来验证土壤第二分类级别的预测地图。与内部验证相比,GA和kappa分别增加到0.38和0.25(表6)。这些结果类似于其他作品中遇到的结果。使用基于SySI和土壤转移函数的决策树开发了土壤自动分类方法。他们对二级土壤类别的预测结果与大面积土壤相似,但对于年轻土壤,准确性较低。详细的环境变量(尤其是与排水有关的变量)对于检索这些土壤类别的地形格局至关重要。
05
结论
在这项研究中,我们得出以下结论:
i)包括DN信息对于改进DSM应用程序很有用;
ii)使用大规模数据源计算环境变量很重要;
iii)在空间上分布良好的土壤信息和进行土壤建模的强大机器学习技术。将数据集1与卫星信息一起使用可以将土壤知识外推到较大的代表性区域。与排水相关的属性对模型的性能贡献最大(GA=56%),并改善了土壤图的推断。将通道模式与土壤分布联系起来的理论基础对于证明我们的方法具有重要意义,RF算法以定量的方式证明了这种关系。通过对直到第二次土壤分类的建模获得的结果当预测到更多的土壤类别时,分类级别显示的性能与其他外推研究相比具有较低的准确性(GA=0.38)。关于模型的性能,我们得出结论,重要的是选择一个适当规模的数据源,以便以1:20,的规模表示土壤信息的分布。因此,详细的DN信息可用于改善土壤科学家的决策,简化基于隐性知识的土壤绘图的复杂过程。卫星信息和地形属性也是识别景观中不同图案,减少野外工作的时间和成本以及制作详细比例的可靠地图的重要工具。进一步的研究应应用与排水有关的属性,并将更多的水文知识应用于DSM。
参考文献
[1]AbbaszadehAfshar,F.,Ayoubi,S.,Jafari,A.,.TheextrapolationofsoilgreatgroupsusingmultinomiallogisticregressionatregionalscaleinaridregionsofIran.Geoderma,36–48.
转载请注明:http://www.jiushirangr.com/dxdm/22592.html