Según el estándar ISO/IEC 8000-100, los datos maestros son “los datos mantenidos por una organización que describe las entidades que son independientes y fundamentales para una empresa que necesita hacer referencia para realizar sus transacciones y que son esenciales para el negocio principal de una empresa”. Los datos, junto con el conocimiento asociado (metadatos), pueden compartirse de forma interna dentro de la organización (es decir, diferentes aplicaciones que soportan varios procesos de negocio) y de forma externa con algunos otros stakeholders. Este conocimiento suele incluir los siguientes elementos de datos maestros: entidades clave y atributos, metadatos (de negocio-incluyendo valores de referencia-, técnicos, tecnológicos), atributos, definiciones, roles, conexiones y taxonomías asociadas.
Todos estos elementos deben describirse y documentarse adecuadamente en los correspondientes catálogos y diccionario de datos. Las entidades maestras clave pueden agruparse en tres grandes grupos: socios (organizaciones, clientes, …), lugar (ubicaciones, oficinas, …) y cosas (producto, servicios, …). Todas las entidades maestras junto con sus descripciones y definiciones acordadas se pueden documentar en los glosarios de negocio.
Los datos maestros tienen las siguientes características: existencia independiente -en contraste con otros tipos de datos (es decir, transaccionales)-, baja frecuencia de cambio (debido a su estabilidad a lo largo del tiempo), y volumen de datos constante (la cantidad de conocimiento se limita al dominio de la organización).
Así mismo, los datos maestros se diferencian de cualquier otro tipo de datos regulares en estos otros aspectos:
- Los datos maestros se refieren a entidades organizacional clave, la referencia de los datos tiene un nivel de granularidad inferior para los atributos de los datos maestros y no se limitan a un dominio determinado
- Los datos maestros no suelen ser responsabilidad de un único departamento, sino de distintos dominios del negocio (ventas y marketing, operaciones, desarrollo de productos, adquisición y cadena de suministros), por lo que la semántica de los datos debe reconciliarse, coordinarse y unificarse entre los diferentes departamentos.
- Los datos maestros describen siempre características básicas (por ejemplo, el nombre del producto) que pueden formar parte de los datos transaccionales (por ejemplo, los pedidos) o de los datos de inventario (por ejemplo, los datos del producto), por tanto, deben ser definidos sin ningún tipo de ambigüedades y ser mantenidos diligentemente.
- Los datos maestros se mantienen inalterados durante más tiempo que otros tipos de datos y, normalmente para algunas organizaciones, son la base a partir de la cual se evolucionará progresivamente la descripción de las entidades que son importantes para la organización.
- Las instancias de las clases de datos maestros o los registros de datos maestros (sistemas de registros) suelen tener un volumen más constante que los datos transaccionales.
Los datos maestros suelen utilizarse como base para los datos transaccionales. La implementación de sistemas de gestión de datos maestros suele incluir estos cuatro componentes principales:
- módulo de integración de datos,
- repositorio de datos maestros -cuya calidad es el foco de este trabajo-,
- repositorio de metadatos (es decir, diccionario de datos), y
- módulo de calidad de datos.
Estos componentes utilizarán una amplia gama de los siguientes artefactos: modelos de datos, diccionarios de datos con datos de referencia (el repositorio de metadatos más común), arquitectura funcional, mapeo de fuentes a objetivos, ciclo de vida de los datos y análisis CRUD que indica la asignación de permisos a grupos de usuarios para crear, leer, actualizar y eliminar los datos maestros.
Los diccionarios de datos contienen metadatos que proporcionan información crítica sobre los datos. Es una práctica habitual identificar los metadatos más valiosos, así como un conjunto de valores válidos sobre los datos maestros para los datos maestros. Este conjunto de valores válidos, también conocido como datos de referencia, puede definirse como una lista de valores válidos (por ejemplo, lista de códigos de moneda o de nación como los recogidos en ISO 4217 o ISO 3166) o mediante procedimientos para construir valores válidos (por ejemplo, expresiones regulares para validar una dirección de correo electrónico).
Para garantizar que los atributos de los registros de datos maestros (especialmente los identificadores) toman valores del conjunto de valores válidos, se deben habilitar mecanismos adecuados para la codificación sintáctica y semántica, como se explica en el estándar ISO 800-110. Esta codificación puede ser útil cuando es necesario identificar inequívocamente una entidad maestra específica dentro de un conjunto de datos, cuando es necesario anonimizar la información con fines de protección personal, o incluso cuando se requiere cifrar la información con fines de seguridad. Para apoyar mejor la codificación, es conveniente la creación de un diccionario de datos. En este sentido, se puede decir que un diccionario de datos contiene y gestiona la definición semántica de los términos de los datos maestros que proporcionarían la descripción de negocio y técnica de estos. Estas definiciones semánticas se utilizarán posteriormente para construir los repositorios de datos maestros que contienen lo que también se ha llamado el registro dorado. Un registro de oro o “golden record” es un superconjunto de todos los atributos de los datos maestros, cuyos valores han sido integrados desde todas las fuentes de datos disponibles para la misma entidad del mundo real. Estos aspectos son importantes para la calidad de los datos del propio repositorio de datos maestros.
Sin embargo, los datos maestros son mucho más que una tecnología, y por experiencias en la industria, una mala gestión de los datos maestros es la causa de que las iniciativas organizacionales puedan sufrir una pérdida de rendimiento o incluso una falta de calidad de los datos. La gestión de datos maestros requiere una combinación de procesos, gobierno de datos e implementación técnica de la tecnología que permita a las organizaciones obtener los máximos beneficios de los datos. A continuación, se identifican algunos de estos beneficios:
- Conocimiento más amplio de los clientes.
- Servicio mejorado a los clientes.
- Gestión de creación de informes consistentes.
- Competitividad mejorada.
- Gestión mejorada de riesgos.
- Eficiencia operacional mejorada y costes reducidos.
- Toma de decisiones mejorada.
- Mejor realización de análisis y planificación.
- Cumplimiento regulatorio.
- Mejor calidad de datos.
- Resultados más rápidos.
- Productividad de negocio mejorada.
- Desarrollo de aplicación simplificados.