Minería de datos y texto para la detección de fraude en contratos públicos: caso de estudio Sistema Oficial de Contratación Pública de Ecuador

Torres Berrú, Yeferson

Título

Minería de datos y texto para la detección de fraude en contratos públicos: caso de estudio Sistema Oficial de Contratación Pública de Ecuador

Otros títulos

Data and Text Mining for the Detection of Fraud in Public Contracts: A Case Study of Ecuador’s Official Public Procurement System

Autor(es)

Torres Berrú, Yeferson

Director(es)

López Batista, Vivian Félix

Palabras clave

Tesis y disertaciones académicas

Universidad de Salamanca (España)

Tesis Doctoral

Academic dissertations

Corrupción

Data mining

Abastecimiento público

Clasificación UNESCO

1209 Estadística

Fecha de publicación

2023

Resumen

[ES] La hipótesis de esta tesis doctoral se basa en la aplicación de la minería de datos en el análisis e identificación de riesgos de corrupción en las compras públicas. Concretamente, que, a través de la evaluación de los datos y el texto generado en las fases de cada proceso, mediante la combinación de técnicas de aprendizaje automático y PLN, se pueda detectar si ha existido corrupción y clasificar su tipo (sobreprecio, favoritismo, sesgo). El proceso se inicia desde la obtención de datos en un portal que no cumple con los principios de datos abiertos, como ocurre en Ecuador. Continúa con la realización del análisis exploratorio de los mismos, con el objetivo de encontrar la técnica adecuada para su limpieza y reducción de su dimensionalidad para su tratamiento. Con la base de datos depurada y el texto obtenido, se combinan algoritmos de aprendizaje automático supervisados y no supervisados, para la detección de corrupción en la asignación de contratos públicos. Como el estudio preliminar sobre el tema refleja, que la mayoría de las propuestas recogidas en la literatura son insuficientes y solo están enfocadas a la resolución de problemas muy específicos. Se evidencian algunas necesidades: • Detectar posibles sobreprecios, en base a las compras realizadas en periodos similares por otras instituciones públicas. • Investigar tipos de corrupción como el favoritismo, que ha sido poco estudiado. • La detección de sesgos a través del análisis del texto generado por cada proceso, para encontrar sesgo hacia determinados proveedores o de género. • Poder detectar la combinación de varios tipos de corrupción en un mismo proceso. Por lo tanto, la tesis se centra en establecer una metodología para prevenir y detectar corrupción mediante el uso de técnicas de aprendizaje automático y PLN, con el desarrollo de algoritmos de detección y predicción de sobreprecio, favoritismo y sesgo en compras públicas. Para validar la metodología, se diseñaron diferentes casos de estudio en varias áreas poco exploradas como: el sobreprecio en compras de medicamentos durante la pandemia de COVID-19 en Ecuador, el favoritismo basado en los parámetros de calificación de procesos y los tipos de contratación. Además, se crearon otros casos de estudio, que permitieran analizar el texto generado en cada proceso y poder detectar el favoritismo hacia cierto proveedor y asó como el sesgo de género en cada proceso de compra pública. Todos los resultados fueron evaluados con diferentes técnicas de rendimiento, empezando por el porcentaje de sobreprecio y enfatizando en el porcentaje de acierto de los algoritmos de clasificación. Además, los resultados obtenidos se contrastaron y validaron con las noticias de medios de comunicación y de redes sociales del país, sobre procesos de compras públicas con corrupción.

Descripción

Tesis por compendio de publicaciones.

URI

https://hdl.handle.net/10366/157534

Collections