Saltar al contenido

BPLD: Biblioteca Parametrizable para la Limpieza de Datos

BPLD: Biblioteca Parametrizable para la Limpieza de Datos

Financiado por: Programa de Apoyo a la Innovación Innova-Adelante en Castilla-La Mancha, cofinanciable en el marco del Programa FEDER de Castilla-La Mancha 2021-2027.
Importe total: 114.559,58 euros.
Código Identificador: 13/23/IN/023


Este proyecto, denominado BPLD (Biblioteca Parametrizable para la Limpieza de Datos), nace de la necesidad creciente de mejorar la calidad de los datos en las organizaciones, especialmente en un contexto donde la explotación avanzada de datos, como la inteligencia artificial o el machine learning, depende directamente de la fiabilidad de la información.

El proyecto parte de la idea de que la calidad de los datos no solo debe evaluarse, sino también mejorarse de forma sistemática. Para ello, se propone desarrollar un conjunto de primitivas de limpieza alineadas con los estándares internacionales ISO/IEC 25012 e ISO/IEC 25024, que permitan aplicar mejoras dirigidas a propiedades específicas de calidad del dato previamente evaluadas.

El objetivo principal del proyecto BPLD es desarrollar una biblioteca de primitivas para la mejora de la calidad de los datos, con una implementación parametrizable en R Software. Este objetivo se despliega en cuatro objetivos específicos:

  • Revisar el estado del arte sobre métodos de mejora de la calidad de datos.
  • Elaborar un mapeo entre características de calidad de datos y métodos de mejora.
  • Desarrollar e implementar en R una biblioteca de primitivas parametrizables para la mejora.
  • Validar la efectividad de las primitivas mediante su aplicación en un caso real.

El resultado del proyecto permitirá disponer de una base metodológica y técnica para abordar la mejora de datos de forma estructurada, reutilizable y basada en estándares, facilitando su integración en procesos de análisis y explotación de información.

Publicaciones

No hay publicaciones asociadas a este proyecto