A nadie se le escapa que disponer de unos datos de calidad en una organización es fundamental. Por desgracia, conseguirlo, es una ardua y complicada tarea que requiere una alta dedicación.
La información, los datos, lo creamos o no, tienen su propio ciclo vital:
- Se crean, cuando se registran datos por primera vez en un sistema.
- Se transforman, cuando se utilizan los programas que hacen uso de ellos.
- Se consumen, por las personas o programas que los necesitan para su negocio.
- Se replican, cuando son necesarios en distintos ámbitos independientes entre sí.
- Mueren, cuando se quedan obsoletos.
Durante este ciclo vital, los datos sufren múltiples procesos que van en detrimento de su calidad. Los más habituales son: la entrada manual de datos, la migración de datos, los errores en programas informáticos y la incorporación de datos externos.
Como consecuencia de la mala calidad de los datos se toman malas decisiones, se tienen clientes insatisfechos, se complican o imposibilitan nuevas implantaciones de sistemas y se incurre en sobrecostes para las organizaciones.
Pero, ¿Qué podemos hacer para minimizar o mitigar la mala calidad de los datos?
La respuesta es implantar una metodología, apoyada en las herramientas necesarias, que se preocupe de mantener la calidad de los datos durante todo su ciclo de vida.
- Descubrir: e identificar los datos y el origen de los mismos.
- Perfilar: establecer los indicadores por los que vamos a medir la calidad de los datos, con el objetivo de realizar un seguimiento de la evolución de los mismos.
- Limpiar: se definen las reglas y objetivos que tienen que cumplir los datos para que se considere que tienen una calidad adecuada para el propósito de los mismos.
- Matching: una vez definidas las reglas y objetivos hay que diseñar el plan de acción para llevarlos a la práctica. No basta con solucionar los problemas de calidad actuales sino prevenir que no se vuelvan a dar.
- Consolidar: Poner en práctica las reglas establecidas en “Limpiar” y el plan de acción del “matching”
- Monitorizar: una vez definidas las metodologías y herramientas hay que realizar un seguimiento para verificar que la calidad de los datos está mejorando y que no existen nuevas fuentes de datos de mala calidad.
Para que este proceso sea un éxito, es necesaria la implicación de todos los participantes en el ciclo de vida de los datos. Requiere dedicación, tiempo y una metodología bien definida, pero sin duda, aquellas organizaciones que no realicen el cambio hacia una organización data driven quedarán en clara desventaja respecto a las que lo hayan realizado.
Espero que haya resultado de interés y agradezco el tiempo dedicado.