Decision tree and geostatistics in reducing the number of soil micronutrient analyses

Authors

Keywords:

Sample density, Statistical learning, Ordinary kriging

Abstract

To carry out interpolation by kriging, it is important that each point in a semivariogram is obtained from at least a combination of 30 pairs of points in at least 100 samples, which makes the process expensive for the farmer. As an alternative, machine learning methodologies were used, particularly decision trees. The main objective of this work was to evaluate the use of the decision tree methodology to reduce sample density for soil attributes in order to perform ordinary kriging with a reduced sample size. To this end, 50 samples were taken using the Latin Hypercube Sampling (LHS) algorithm, with meshes containing 82, 112 and 127 sampled points and the missing values were predicted using the decision tree, until 150 points were completed and then ordinary kriging was carried out for the MR127, MR112 and MR82 meshes, which was generated by combining the 50 predictions by decision tree and evaluating the values of the Root Mean Square Error (RMSE) and Mean Absolute Error (MAE).

It was noticeable that there is a reduction in these statistics as the number of original samples is reduced. When mapping the attributes of the reduced meshes, it can be seen that the micronutrient concentration pattern of the soils in the reduced meshes is similar to the original pattern, i.e. areas with higher concentrations still have high concentrations and regions with lower concentrations still have lower concentrations. Therefore, the use of decision trees proved to be efficient in preserving the soil's micronutrient concentration pattern.

 

 

References

ALBUQUERQUE, J. A.; REINERT, D. J.; FIORIN, J. E. Variabilidade de solo e planta em Podzólico Vermelho-Amarelo. Revista Brasileira de Ciência do Solo, v. 20, n. 1, p. 151-157, 1996.

BOYER, D. G.; WRIGHT, R. J.; FELDHAKE, C. M.; BLIGH, D. P. Relações de variabilidade espacial do solo em um ambiente de solo ácido de declive acentuado. Soil Science, v. 161, n. 5, p. 278-287, 1996.

CAMBARDELLA, C. A.; MOORMAN, T. B.; NOVAK, J. M.; PARKIN, T. B.; KARLEN, D. L.; TURCO, R. F.; KONOPKA, A. E. Field‐scale variability of soil properties in central Iowa soils. Soil Science Society of America Journal, v. 58, n. 5, p. 1501-1511, 1994.

CHERUBIN, M. R.; SANTI, A. L.; EITELWEIN, M. T.; AMADO, T. J. C.; SIMON, D. H.; DAMIAN, J. M. Dimensão da malha amostral para caracterização da variabilidade espacial de fósforo e potássio em Latossolo Vermelho. Pesquisa Agropecuária Brasileira, v. 50, p. 182- 177, 2015.

CORÁ, J. E.; FERRARESE, C. P.; OLIVEIRA, F. S.; CORÁ, J. A.; BORGES, J. C.; LIMA, J. R.; HERRMANN, R.; CRUZ, L. M. Variabilidade espacial de atributos do solo para adoção do sistema de agricultura de precisão na cultura de cana-de-açúcar. Revista Brasileira de Ciência do Solo, Viçosa, v. 28, n. 6, p. 1013-1021, 2004. Disponível em: https://doi.org/10.1590/S0100-08232004000600010. Acesso em: 01 nov. 2023.

DAHIKAR, S. S.; RODE, D. S. V. Agricultural crop yield prediction using artificial neural network approach. International Journal of Innovative Research in Electrical, Electronics, Instrumentation and Control Engineering, v. 2, n. 1, p. 823–826, 2014. Disponível em:

https://www.ijireeice.com/upload/2014/ijireeice-2844.pdf. Acesso em: 23 out. 2023.

DE OLIVEIRA, S.; SCHNEIDER,; PW. Viabilidade econômico-financeira da agricultura de precisão no cultivo do tabaco em uma propriedade rural localizada em sobradinho/rs. revista de contabilidade dom alberto, v. 13, n. 25, p. 147-176, 2024.

EL-SAYED EWIS, O. Improving the prediction accuracy of soil mapping through geostatistics. International Journal of Geosciences, v. 2012, 2012.

FATORGIS. Agricultura de precisão: A tecnologia de GIS/GPS chega às fazendas. Curitiba, 1998. Disponível em: http://www.fatorgis.com. Acesso em: 21 out. 2023.

GREGO, C.R.; VIEIRA, S.R. Variabilidade espacial de propriedades físicas do solo em uma parcela experimental. Revista Brasileira de Ciência do Solo, Viçosa, v. 29, n. 2, p. 169-177, 2005. Disponível em: https://www.scielo.br/j/rbcs/article/view/32799. Acesso em: 01 nov. 2023. doi:10.1590/S0100-08232005000200002.

IZBICKI, R.; DOS SANTOS, T. M. Aprendizado de máquina: uma abordagem estatística. Rafael Izbicki, 2020.

ISAAKS, E. H.; SRIVASTAVA, R. M. Applied geostatistics. New York: Oxford University Press, 1989.

JAMES, G.; WITTEN, D.; HASTIE, T.; TIBSHIRANI, R.; TAYLOR, J. An introduction to statistical learning: With applications in R. Springer Nature, 2013.

MANZATTO, C. V.; BHERING, S. B.; SIMÕES, M. Agricultura de precisão: propostas e ações da Embrapa Solos. EMBRAPA Solos, 1999. Disponível em: http://www.cnps.embrapa.br/search/pesqs/proj01/proj01.html. Acesso em: 02 fev. 2023.

MENDES, W. S.; DEMATTÊ, J. A. M.; BARROS, A. S.; SALAZAR, D. F. U.; AMORIM, M. T. A. Geostatistics or machine learning for mapping soil attributes and agricultural practices. Revista Ceres, v. 67, n. 4, p. 330–336, 2020. Disponível em: https://doi.org/10.1590/0034-737X202067040010. Acesso em: 29 jul. 2023.

OLIVER, M.A. Exploring soil spatial variation geostatistically. In: EUROPEAN CONFERENCE ON PRECISION AGRICULTURE, 2, 1999. Odense. Proceedings. Silsoe: Sheffield, 1999. p. 03-18.

PANTAZI, X. E.; MOSHOU, D.; ALEXANDRIDIS, T.; WHETTON, R. L.; MOUAZEN, A. M. Wheat yield prediction using machine learning and advanced sensing techniques. Computers and Electronics in Agriculture, v. 121, p. 57–65, 2016.

PAZ-GONZÁLEZ, A.; SÁNCHEZ, J. S.; FRUTOS, M. A.; MORENO, J. A.; ALBA, L. The effect of cultivation on the spatial variability of selected properties of an umbric horizon. Geoderma, v. 97, p. 272–292, 2000.

PEREIRA, G. W.; VALENTE, D. S. M.; DE QUEIROZ, D. M.; SANTOS, N. T.; FERNANDES-FILHO, E. I. Soil mapping for precision agriculture using support vector machines combined with inverse distance weighting. Precision Agriculture, v. 23, p. 1189-1204, 2022. Disponível em: https://doi.org/10.1007/s11119-022-09880-9. Acesso em: 01 nov. 2023.

PYRCZ, M.; DEUTSCH, C. Geostatistical reservoir modeling. 2. ed. New York, NY: Oxford University Press, 2014.

QU, L.; LU, H.; TIAN, Z.; SCHOORL, J. M.; HUANG, B.; LIANG, Y. Spatial prediction of soil sand content at various sampling density based on geostatistical and machine learning algorithms in plain areas. Catena, v. 234, p. 107572, 2024.

REGHINI, F.; L; CAVICHIOLI, Fábio Alexandre. Utilização de geoprocessamento na agricultura de precisão. Revista Interface Tecnológica, v. 17, n. 1, p. 329-339, 2020.

SOARES, A. Geoestatística para as Ciências da Terra e do Ambiente. Lisboa: IST Press, 2000.

SOUZA, C. K.; MARQUES JÚNIOR, J.; MARTINS FILHO, M. V.; PEREIRA, G. T. Influência do relevo na variação anisotrópica dos atributos químicos e granulométricos de um Latossolo em Jaboticabal, SP. Engenharia Agrícola, v. 23, n. 3, p. 486-495, 2003.

TANTALAKI, N.; SOURAVLAS, S.; ROUMELIOTIS, M. Data-driven decision making in precision agriculture: The rise of big data in agricultural systems. Journal of Agricultural & Food Information, v. 20, n. 4, p. 344-380, 2019.

VIEIRA, S. R. Geoestatística em estudos de variabilidade espacial do solo. In: NOVAIS, R. F. de; ALVAREZ V., V. H.; SCHAEFER, C. E. G. R. (Ed.). Tópicos em ciência do solo. Viçosa, MG: Sociedade Brasileira de Ciência do Solo, 2000. v. 1, p. 1-54.

YAMAMOTO, J. K.; LANDIM, P. M. B. Geoestatística: conceitos e aplicações. São Paulo: Oficina de Textos, 2013. Disponível em: https://www.ofitexto.com.br. Acesso em: 24 fev. 2023.

YANG, L.; LI, X.; SHI, J.; SHEN, F.; QI, F.; GAO, B.; ZHOU, C. Evaluation of conditioned Latin hypercube sampling for soil mapping based on a machine learning method. Geoderma, v. 369, p. 114337, 2020.

Published

21-01-2025

How to Cite

Batista, L. G., Gouvêa Oliveira, S., Terra Santos, N., Peternelli, L. A., Marques Costa, M., & Ferreira, M. de P. (2025). Decision tree and geostatistics in reducing the number of soil micronutrient analyses. Sigmae, 13(5), 114–127. Retrieved from https://publicacoes.unifal-mg.edu.br/revistas/index.php/sigmae/article/view/2536

Issue

Section

Applied Statistics