Saltar al contenido

Calidad de Datos

La calidad de los datos es un factor clave, debido a que si los datos no tienen un nivel de calidad adecuado, su uso en cualquier iniciativa de la organización (Business Intelligence, Inteligencia Artificial, Machine Learning, etc.) no permitirá obtener los mejores resultados. El acierto de las decisiones que toma una organización depende de la calidad de los datos en los que se basan dichas decisiones. Sin embargo, las organizaciones no suelen disponer de medios que evalúen la calidad de sus datos. Por ello, en DQTeam hemos desarrollado un marco de trabajo para la evaluación y mejora de la calidad de los datos.

La evaluación de la Calidad de Datos se realiza a partir de las siguientes Características

Para conocer el nivel de Calidad de sus Datos únicamente necesita

  • Acceso a una copia de los datos que desea evaluar.
  • Los requisitos de calidad de sus datos, es decir las reglas que deben cumplir sus datos como por ejemplo: atributos que no  deben ser nulos, expresiones regulares, atributos que deben ser únicos, etc.
  • El modelo de datos, que debe contener al menos el nombre de las tablas, los atributos que componen cada tabla y la relación entre las tablas.

¿EVALUACIÓN Y MEJORA DE LA CALIDAD DE LOS DATOS?

La Evaluación y Mejora de la Calidad de Datos analiza las características de calidad que presentan los datos almacenados por la organización, detecta sus debilidades y propone las mejoras necesarias para asegurar que los datos almacenados tengan la calidad deseada.

DQTeam ha tomado un subconjunto de las Características definidas en la norma ISO/IEC 25012 como referencia para la evaluación de la calidad de los datos, permitiendo así a las organizaciones obtener una evaluación independiente de la calidad de sus datos.

La evaluación de la Calidad de Datos se realiza a partir de las siguientes Características

  • Exactitud: Los datos tienen atributos que representan correctamente el verdadero valor del atributo deseado de un concepto o evento en un contexto especificado.
  • Completitud: Los datos asociados con una entidad tienen valores para todos los atributos necesarios para la representación de la entidad.
  • Consistencia: Los datos están libres de contradicción y son coherentes con el resto de datos de su contexto de uso determinado.
  • Credibilidad: Los datos tienen atributos que se consideran ciertos y creíbles para los usuarios.
  • Actualidad: Los datos tienen atributos con valores actualmente válidos para su contexto de uso determinado.