Consejos sobre qué, cómo y dónde deben recogerse los datos
Cómo la calidad de los datos puede llevarnos a obtener respuesta a nuestras preguntas Sólo se puede obtener información a partir de datos si éstos […]
Cómo la calidad de los datos puede llevarnos a obtener respuesta a nuestras preguntas
Sólo se puede obtener información a partir de datos si éstos son buenos y de calidad. Cuanta más calidad y datos tenga, más información podrá obtener.
Por eso, para conseguirlo, te damos 23 consejos para que tu organización empiece, o definitivamente consiga, sacar el máximo valor de los datos.
3 factores a tener en cuenta a la hora de decidir dónde guardar los datos
- La cantidad de datos que va a recopilar.
- La frecuencia con que se consultarán los datos.
- La urgencia para obtener los datos cuando se soliciten.
¿Por qué debe contemplar estos tres factores?
3 consejos para saber dónde guardar los datos
- Si la obtención rápida de los datos no es fundamental, almacénelos en niveles de almacenamiento más lentos, pero más baratos (almacenamiento «en frío»), para que el volumen no repercuta tanto en el coste.
- Almacene en niveles de alta velocidad (almacenamiento «caliente») los datos que se solicitan con más frecuencia o cuya urgencia de obtención es alta (dependerá de lo importante que sea obtener los datos a tiempo).
- Diseñe su solución de datos de modo que la rotación entre niveles «calientes» y «fríos» se adapte a su caso de uso. No sólo le ahorrará costes, sino que también optimizará el rendimiento en la mayoría de los escenarios.
Pasando a la parte más importante, hablamos de qué datos necesitas almacenar. Esto dependerá de si tus datos son de calidad o no, por lo que te recomendamos leerlo varias veces hasta que te quede completamente claro.
12 consejos para saber qué datos deben almacenarse
- Almacene los datos no urgentes en dispositivos con gran capacidad y tiempos de acceso lentos. Estos datos pueden referenciarse con punteros situados en dispositivos más rápidos.
- En la misma situación que la anterior, comprimir los datos también es una buena idea.
- No te preocupes por definir esquemas diferentes según los usuarios de los datos (el caso más común suele ser por motivos de privacidad) ya que crearás esquemas lógicos a partir de los datos ya guardados.
- Estudia las relaciones entre conceptos, ya que ejecutar una consulta puede implicar recuperar muchos datos innecesarios. Intente pensar en las operaciones que se realizarán con más frecuencia y cree pocas relaciones intermedias entre conceptos relacionados.
- Cuantos más datos numéricos almacene, mejor.
- Si categorizas los datos, por ejemplo, a las personas mayores de edad les asignas 1, y a las que no, 0, guarda siempre en algún lugar cómo se han calculado esos valores, en este caso almacenando también el valor bruto de la edad.
- Guarda las fechas y horas de las operaciones y transacciones.
- Hay casos en los que pueden faltar datos en tu fuente de datos. Ten en cuenta el valor lógico por defecto para los que falten.
- Conozca la codificación en la que guardará sus datos (¿UTF-8?).
- Escribe validaciones para prohibir aquellos valores de datos que no tengan sentido. Cuando algunos valores lo incumplan, piensa si debes rechazar la inserción de esos datos, o si debes establecer valores por defecto.
- Cuando tengas mucha urgencia en obtener ciertos datos que requieran muchas operaciones computacionalmente costosas, es muy posible que necesites precalcular esos datos y almacenarlos de forma redundante para poder recuperarlos más rápidamente.
- El tipo fecha es mucho más lento que el tipo entero, por lo que si no tiene restricciones de almacenamiento, es preferible tener valores separados para los componentes de fecha y hora (año, mes, hora, etc.) para realizar operaciones con datos numéricos en lugar de con el tipo fecha.
8 Consejos para empezar a tomar datos
- Empiece siempre por sus activos y procesos más importantes. No tenga muy en cuenta sus objetivos o KPI actuales, céntrese en obtener datos de ellos. Si tus objetivos cambian con el tiempo, tendrás que cambiar completamente el esquema de los datos obtenidos hasta el momento y tus datos tendrán poco valor (si es que tienen alguno).
- Empieza a tomar datos poco a poco, no intentes crear un gran esquema de datos al principio, empieza poco a poco y ve aumentando tu esquema a medida que te sientas cómodo (sé ágil).
- El proceso de ingesta debe ser periódico y metódico. Nos referimos a que la frecuencia con la que se obtienen los datos debe estipularse en función del tiempo que sea necesario recopilarlos.
- Sé realista, obtener datos hasta tener un proceso automatizado puede ser laborioso, sé consciente de los recursos que tienes disponibles para dedicarle.
- Siga formatos estándar, le ahorrará tiempo y dinero.
- Haz copias de seguridad periódicas. Siempre pueden producirse errores, por lo que consideramos de suma importancia que crees unas copias de seguridad descentralizadas y redundantes.
- Dale importancia a los metadatos (datos que describen los datos), como marcas de tiempo, etc.
- Una vez que tengas todo lo anterior, entonces puedes empezar a pensar en tener más datos, por ejemplo, puedes empezar a tener datos sobre el tiempo de un día concreto (si eso es importante para ti), datos sobre tu competencia, sobre tu cuota de mercado, etc. En otras palabras, datos que no forman parte directamente de tu negocio, pero que tienen un impacto en él.
Importante: Los resultados y beneficios que proporcionan los datos no se obtendrán hasta un determinado momento. Por lo tanto, para obtener información relevante, necesita una cantidad mínima de datos sustanciales (sea constante).
Esperamos de todo corazón que estos consejos te ayuden a sacar el máximo partido a tus datos. No obstante, si aún no sabe por dónde empezar, póngase en contacto con nosotros y le ayudaremos a convertir su organización en Data Driven.