Debido a la distinta naturaleza de los datos, y su uso en la organización, existen distintos tipos de datos. Debido a la variedad de fuentes existentes, en este artículo se establece una clasificación de los distintos tipos de datos en cuatro grandes categorías, y teniendo un quinto tipo transversal a los cuatro anteriores:
- Los datos maestros son los más críticos para las organizaciones. Estos datos, son los que contextualizan los datos transacciones en la organización. Además, los datos maestros proporcionan la base de apoyo para las actividades comerciales de las empresas, que son los datos que realmente proporcionan la información. Algunos ejemplos de datos maestros son los clientes, los productos, los proveedores, los pacientes, las políticas o las ubicaciones.
- Los datos de referencia representan valores codificados de una determinada manera que son establecidos dentro de un catálogo de posibles valores para determinados valores de los atributos de los registros de datos maestros. Además, estos datos son aceptados y validados por un grupo específico de trabajo, que tiende incluso a normalizados (por ejemplo, nombres de provincias o códigos de países). Es importante gestionar adecuadamente este tipo de datos en la MDM, ya que de esta forma se obtendrá con certeza una mayor calidad de los datos.
- Los datos transaccionales representan las interacciones entre los datos maestros en las aplicaciones organizacionales. Estos datos son generados por las aplicaciones y son usualmente almacenados en Data warehouse o Datamart, para su posterior uso en procesos de inteligencia de negocios. Un ejemplo de datos transaccionales son los datos que establecen la relación entre los productos y el cliente que compra.
- Los datos transaccionales tienen una dimensión temporal y se convierten en datos históricos una vez que se completa la transacción. Los datos históricos contienen hechos significativos, a partir de un determinado momento, que no deben ser alterados salvo para corregir un error. Un ejemplo de ello son las transacciones finalizadas (relación entre los clientes y los productos comprados y entregados)
- Los metadatos son datos que describen y definen otros datos. También pueden definirse como datos descriptivos de otros recursos. Por ejemplo, información sobre los niveles de calidad de un conjunto de datos.
A continuación, se muestra una comparativa de tipos de datos:
Clase de Datos |
Amplitud de datos |
Volumen |
Frecuencia Actualización |
Número de Columnas |
Ejemplos |
Propietarios o Stewards |
Sistema típico de registro |
Metadatos |
Organización |
Muy baja |
Casi estática |
Varias |
Definiciones de atributos |
Organización |
Repositorio de Metadatos |
Datos de Referencia Core |
Organización, o casi toda la organización |
Baja |
Muy Baja |
Pocas |
SIC, Países, Códigos de Divisas, Esquemas ISSO |
Normalmente externos a la organización |
Repositorio de datos de referencia corporativo |
Datos Maestros Comunes |
Múltiples sistemas abarcando la organización |
Medio |
Bajo |
Muchas |
Cliente, Empleado, Producto, Cuentas Bancarias |
Principalmente usuarios que lo crean o lo necesitan |
Varios escenarios |
Datos Transaccionales |
Transacciones actuales |
Alto |
Medio |
Muchas |
Compras, inversiones, … |
Sistema que generaron las transiciones |
Sistema que generaron las transiciones |
Datos Jerárquicos |
Relaciones con otros datos |
Bajo |
Bajo |
Pocas |
Jerarquías de productos, cuentas, y organizaciones |
Sistema que generaron las transiciones |
Sistemas de contabilidad y de productos |
Datos no estructurados |
Cualquier documento, correos electrónicos |
Alto |
Alto |
Muchos |
White papers, artículos, portales corporativos |
Principalmente usuarios que los crean o lo necesitan |
Varios escenarios |
Datos de auditoría |
Metadatos, datos transaccionales |
Muy alto |
Raramente |
Pocos |
Marcas de tiempo (timestamp), Identificadores de usuarios, log de ficheros |
Organización |
Sistemas que generan los datos de auditoría |
Datos Derivados |
Organizaciones, pero frecuentemente departamentos específicos |
Muy alto |
Medio |
Muchos |
Datamarts financieros, MDDBs |
Organizacional o departamental |
Sistemas que los generan |