Application of classification algorithms for the estimation of soil organic carbon in the province of Chimborazo, Ecuador

Main Article Content

Oscar Roberto Padilla-Sefla
Silvia Mariana Haro-Rivera

Abstract

The objective of the study was to evaluate the decision tree technique using the best supervised classification algorithm, which allows predicting the edaphic carbon content in the province of Chimborazo in native or endemic areas, considering the database of the Ministry of Agriculture and Levestock (MAG). In the estudy, the data set was cleaned and 10 useful variables were determined for the categorization of soil organic carbon, obtaining 4 classes: Very High, High, Medium and Low. The alforithm that provided the best percentage of efficiency and relevant results was Classification and Regression Trees (CART) using the cross-validation method. The refficiency of three algorithms was determined: C5.0, SMV and CART, selecting the CART by means of the cross-validation method for the construction of the tree. The results with the test data set generated a precision of 63.41 percentage points and a prediction error of 36.59 percent, these scopes are presented as a new alternative for SOC quantification, the calibrated model can be extended without the need to sample in situ, very useful in complex areas such as the forest ecosystem. The digital mapping allowed to reveal the existing SOC levels in soils of the Chimborazo province.

Downloads

Download data is not yet available.

Metrics

Metrics Loading ...

Article Details

How to Cite
Padilla-Sefla, O. R., & Haro-Rivera, S. M. (2021). Application of classification algorithms for the estimation of soil organic carbon in the province of Chimborazo, Ecuador. FIGEMPA: Investigación Y Desarrollo, 12(2), 62–69. https://doi.org/10.29166/revfig.v12i2.3518
Section
Artículos
Author Biographies

Oscar Roberto Padilla-Sefla, Escuela Superior Politécnica de Chimborazo. Riobamba, Ecuador.

Escuela Superior Politécnica de Chimborazo. Facultad de Ciencias, Carrera de Estadística Informática. Riobamba - Ecuador. https://orcid.org/0000-0002-5432-5009 oscar.padilla@espoch.edu.ec

Silvia Mariana Haro-Rivera, Escuela Superior Politécnica de Chimborazo. Riobamba, Ecuador.

Escuela Superior Politécnica de Chimborazo. Facultad de Informática y Electrónica, Carrera de Telecomunicaciones. Riobamba - Ecuador. https://orcid.org/0000-0001-6030-1022

References

Acosta, J., Martínez, D. & Primorac, C., 2018. Determinación de perfiles de rendimiento académico en la UNNE con minería de datos educacional. Argentina.. XX Wokshop de Investigación en Ciencias de la Computación, abril.pp. 1078-1082.

Aguilera, S., 2020. Importancia de la protección de la materia orgánica en suelos. Repositorio Académico, pp. 77-85.

Bartolini, J. L., Alonso, P. & Alvarez, F., 2013. Árboles de clasificación de Potimirim mexicana (Decapoda: Caridea), organismo hermafrodita protándrico secuencial. Latin american journal of aquatic research, 41(4), pp. 739-745.

Blanquer, J., Ibáñez, S. & Moreno-Ramón, H., 2010. La textura del suelo. JOUR, 07 05.

Cárdenas, M., 2015. Evaluación de la calidad de los suelos de páramo intervenidos y no intervenidos en la comunidad Monjas Bajo, Parroquia Juan Montalvo, cantón Cayambe, Quito: Universidad Politécnica Salesiana, sede Quito, Ingeniería en biotecnología de los recursos naturales.

Cristianini, N. & Shawe-Taylor, J., 2000. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods. Londres: Press CU.

Delpino, M., Portillo, V. & Mora, C., 2018. Evaluación de índices espectrales derivados de sensores remotos para la caracterización de ambientes humedales. Agropecuaria, Anais 7mo Simposio de Geotecnologías no Pantanal, pp. 112-121.

Díaz, Z., Fernández, J. & Segovia, M., 2004. Sistemas de inducción de reglas y árboles de decisión aplicados a la predicción de insolvencias en empresas aseguradoras. Revista Electrónica de Comunicaciones y Trabajos de ASEPUMA, Enero.12(1).

Edwars, A. & Bohlen, P., 1996. Biology and ecology of earthworms. Hall C&, London: Springer.

Eyherabide, M., Saínz, H., Barbieri, P. & Echevería, H., 2014. Comparación de métodos para determinar carbono orgánico en suelo. Cienc Suelo, 32(1), pp. 13-19.

Fawcett, T., 2006. An introduction to ROC analysis. sciencedirect, Diciembre.pp. 861-874.

Ferreira, M., Hosoda, B., Franco de Los Santos, E. & Fernandes, A., 2018. Uso de datos abiertos y técnicas de minería de datos para la clasificación de estudiantes de instituciones privadas de educación superior de Belem-PA. Research in Computing Science, Mayo, 147(5), pp. 27-36.

García, H., Flores, H., Khalil-Gardezi, A., Roberto, A., Tijerina-Chávez, L., Peña, M., 2020. Estimación de la fracción de cobertura de la vegetación en maíz (Zea mays) mediante imágenes digitales tomadas por un vehículo aéreo no tripulado (UAV). Fitotecnia Mexicana, 12.Volumen 43.

Gastaldi, C., Urrea, M. & Fernández, P., 1998. Teoría de Decisión: Contribuciones de von Neumann. Divulgaciones Matemáticas, 6(1), pp. 37-42.

Gilabert, M., González-Piqueras, J. & García, J., 1997. Acerca de los Índices de Vegetación. Teledetección, 10.Volumen 8.

Graham, W., 2011. Data mining with Rattle and R.. New York: USA: Springer.

Haro, S., 2019. Árbol de decisión, aplicación con datos meteorológicos. Riobamba, VI Congreso Internacional de la ciencia, tecnología, emprendimiento e innovación, pp. 63-71.

Haro, S., Pazmiño, R., Conde, M. & Peñalvo, F., 2018. Minería de datos para descubrir tendencias en la clasificación de los trabajos de titulación. Quito, III Congreso de ciencia & tecnología, ESPE, pp. 125-128.

Haro, S. Zúñiga, L., Meneses, A., Vera, L. & Escudero, A., 2018. Métodos de clasificación en minería de datos meteorológicos. Perfiles, Octubre, 2(20), pp. 107-113.

INEC, Instituto Nacional de Estadísticas y Censos, 2010. [En línea] Available at: https://www.ecuadorencifras.gob.ec/ambiente-y-agropecuario-2/ [Último acceso: 2020].

Loayza, V., Sevilla, V., Olivera, C., Guevara, M., Olmedo, G., Vargas, R., et al., 2020. Mapeo digital de carbono orgánico en suelos de Ecuador. Revista Científica de Ecología y Medio Ambiente, Mayo-Agosto, 29(2), pp. 1-13.

López de Ulibarri, G. & Pita, S., 1999. Medidas de concordancia. El índice Kappa. Cuadernos de atención primaria, 6(4), pp. 223-226.

López, R., 2002. Degradación del Suelo; causas, procesos, evaluación e investigación. Mérida: CIDIAT.

Martínez, E., Fuentes, J. P. & Acevedo, E., 2008. Carbono orgánico y propiedades del suelo. Revista de la ciencia del suelo y nutrición vegetal, 8(1), pp. 68-96.

Mena, S., 2017. Identificación de áreas afectadas por incendios forestales utilizando imágenes satelitales LANDSAT 8. GEO.SUR, Volumen 12, pp. 15-25.

Ministerio de Agricultura y Ganadería, 2017. SIGTIERRAS, Ecuador [En línea] Available at: http://metadatos.sigtierras.gob.ec/pdf/memoria_mapa_de_ordenes_de_suelos_mag_sigtierras.pdf [Último acceso: 2020].

Ministerio del Ambiente, 2013. Modelo de Unidades Geomorfológicas para la representación cartográfica de ecosistemas del Ecuador continental. [En línea] Available at: http://app.sni.gob.ec/sni-link/sni/Gobierno%20Provincial%20Azuay/limites%20GPA/EstudioLimitesAzuayLoja/Geoformas453103936428118386.pdf [Último acceso: 2020].

Novelli, L. Caviglia, O.P., Melchiori, R., Wilson, M., Quintero, C.E., Sasal, M.C.,et al, 2013. Impacto de la intensificación en el uso del suelo en molisoles y vertisoles de la zona agrícola de Entre Ríos. Ciencia, Docencia y Tecnología Suplemento, 3(3), pp. 1-17.

Perez, B., 2020. Comparación de técnicas de minería de datos para identificar indicios de deserción estudiantil, a partir del desempeño académico. UIS Ingenierías, 19(1).

Pérez, J. & González, F., 2018. Árboles de clasificación vs regresión logística en el desarrollo de competencias genéricas en ingeniería. Computación y Sistemas, Diciembre.pp. 1519-1541.

Quinlan, J. R., 1986. Introduction of decision trees.. Machine Learning, Marzo, 1(1), pp. 81-106.

Quinlan, J. R., 1993. C4.5. Programs for Machine Learning. Baltimore: Kluwer Academic Publishers.

Quintero, M. & Amézquita, E., 2003. CGIAR [En línea] Available at: https://cgspace.cgiar.org/handle/10568/69621 [Último acceso: 2020].

Roche, A., 2009. Árboles de decisión y series de tiempo, Tesis de Maestría en Ingeniería Matemática, Universidad de la República, Facultad de ingeniería. Montevideo.

Rodríguez, S. & Camacho, J., 2018. Los métodos de aprendizaje automático supervisado en la clasificación textual según el grado de especialización. Tonos digital, julio, Issue 35, pp. 131-149.

Romero, C., 2018. Estudio comparativo de algoritmos de inteligencia artificial y minería de datos enfocados a la toma de decisiones empresariales de elecciones de personal, Trabajo de grado, Ingeniería en sistemas, Universidad de Cundinamarca, Bogotá.

Ruiz, S., Sued, M., Vidal, L., Rodríguez, D., Nesbitt, S. & García, Y., 2019. Técnicas de clasificación supervisada para la discriminación entre ecos meteorológicos y no meteorológicos usando información de una radar de banda C.. Meteorológica, 44(1).

Ureña, R., Pérez, F. & Díaz de María, F., 2006. Estimación de probabilidades a posteriori en SMV multiclase para reconocimiento de habla continua. Zaragoza, IV Jornadas en Tecnología del Habla, pp. 213-2018.

Vela, G., López, J. & Rodríguez, M. d. L., 2012. Niveles de carbono orgánico total en el Suelo de Conservación del Distrito Federal, centro de México. Investigaciones Geográficas, Boletín del Instituto de Geografía, UNAM, julio, Issue 77, pp. 18-30.

Villegas, T. T. W., 2013. Sistemas de clasificación de Ecosistemas del Ecuador continental, Ministerio del ambiente. [En línea] Available at: http://app.sni.gob.ec/sni-link/sni/pdot/nivel%20nacional/mae/ecosistemas/documentos/sistema.pdf [último acceso: 2020].

Zhiminaicela, J., Quevedo, J. & Morocho, A., 2020. Deforestación y cambios en la cobertura vegetal del archipiélago de Jambelí, mediante el uso de imágenes satelitales Landsat-8. Manglar, 17(2), pp. 153-157.