Saltar al contenido

Comparativa de dimensiones de calidad de datos en MDM

Varios han sido los profesionales e investigadores que han señalado que las organizaciones se enfrentan a muchos problemas de calidad de datos, como las incoherencias en las definiciones de datos, los formatos de datos y los valores, o la falta de comprensión de la semántica de las definiciones de datos. La gestión de datos maestros ha demostrado ser extremadamente útil para abordar estos problemas y preocupaciones de calidad de datos. En consecuencia, los datos maestros vuelven a requerir una atención especial, ya que contienen el conocimiento organizativo y centralizan el valor organizativo de los datos, especialmente cuando se intercambian con otras organizaciones. Además, dada las características especiales de los datos maestros como elemento unificador y centralizador del conocimiento de la organización, cualquier iniciativa realizada sobre un repositorio de datos maestros, tiene un impacto mucho más grande que cualquier repercusión mucho más importante que la suma de las actuaciones sobre repositorios aislados, aunque éstas no dejen de ser necesarias.

Como los datos maestros, no dejan de ser datos en sí mismos, podría decirse que el cuerpo de conocimiento sobre la gestión de la calidad de los datos es un buen punto de partida para estudiar la calidad de los datos maestros. Sin embargo, aunque varios trabajos han tratado específicamente de abordar cómo la gestión de datos maestros ha ayudado a las organizaciones a resolver los problemas de calidad de los datos, solo unos pocos trabajos abordan la evaluación de la calidad de los repositorios de datos maestros.

La evaluación de la calidad de los datos maestros está estrechamente relacionada con la idea de las dimensiones o características de la calidad de los datos presentadas en ISO/IEC 25012. Estas características de calidad de los datos pueden entenderse como criterios utilizados para evaluar la calidad y pueden utilizarse también como base para la mejora de la calidad. El conjunto de características de calidad de datos que mejor representa los requisitos del usuario en un contexto específico se denomina modelo de calidad de datos.

En el campo de la investigación y transferencia tecnológica, varios autores han identificado diferentes modelos de calidad de datos para diferentes contextos de uso de los datos maestros (véase siguiente tabla), aunque normalmente, no están referidas a las características propuestas en ISO 25012, ni se ha profundizado en las propiedades de ISO 25024 que podrían ser medidas.

 

Allen & Cervo, 2015

Dahlberg et al., 2011

Haneem et al., 2017

Hüner et al., 2011

Loshin, 2010

Fan et al., 2013

Otto et al., 2010

Exactitud

X

 

X

X

X

   

Disponibilidad

 

X

         

Cambio Frecuencia

     

X

     

Integridad

X

   

X

X

X

 

Conformidad

X

           

Coherencia

X

 

X

 

X

X

 

Corrección

           

X

Actualidad

       

X

X

 

Deduplicación

   

X

   

X

 

Integridad

X

X

       

 

Plausibilidad

           

X

Puntualidad

X

X

 

X

X

   

Unicidad

X

     

X

   

Validez

X

           

Por tanto, para cada característica de calidad de los datos, las propiedades y las medidas de calidad de los datos subyacentes deben ser definidas para adquirir un conocimiento cuantitativo sobre la cantidad de calidad de los registros de datos maestros. La definición de medidas de calidad de datos requiere unas reglas de negocio que describan la validez de un registro de datos maestros. En consecuencia, la identificación y validación de estas reglas de negocio es un paso necesario para la evaluación de la calidad de los datos. Las reglas de negocio, entre otras cosas, abordan las formas de asignar valores válidos a los atributos. Como se indicó en artículos anteriores (referencia a post anterior), se planteó la importancia de los diccionarios de datos como contenedores típicos de conjuntos de valores válidos para los datos maestros que luego se utilizan para construir los registros dorados almacenados en el repositorio de datos maestros. En consecuencia, puede decirse que, si se implementan correctamente, los diccionarios de datos constituyen una de las fuentes de reglas de negocio más importantes. Por ejemplo, los diccionarios de datos pueden ayudar a respaldar mejor la calidad de los datos cuando una organización del ámbito de la banca o los seguros ha decidido adoptar el Global Legal Entity for Identifiers (GLEI) para construir y utilizar identificadores específicos para sus socios, o ISO 21586 para sus productos correspondientes, o cuando una empresa de fabricación ha decidido adoptar el Global Trade Item Number (GTIN) para codificar los identificadores de sus productos. Hasta cierto punto, es posible afirmar que la calidad de los repositorios de datos maestros depende en gran medida de la calidad del diccionario de datos.