Saltar al contenido

Tips sobre qué, cómo y dónde deben recogerse los datos

Home > Blog > Tips sobre qué, cómo y dónde deben recogerse los datos

Disponer de datos de calidad puede llevarnos a solucionar nuestras preguntas

La obtención de información a partir de los datos sólo se puede conseguir si son datos buenos y de calidad. Cuanta más calidad y datos tenga, más información podrá obtener.

Por eso, para conseguirlo, te damos 23 tips para que tu organización empiece o definitivamente obtenga el máximo partido de los datos.

3 factores a tener en cuenta para decidir dónde almacenar los datos
  1. Cantidad de datos que vas a recopilar.
  2. Frecuencia con la que se consultarán los datos.
  3. Urgencia para obtener los datos cuando se soliciten.

¿Por qué debe considerar estos tres factores?

3 consejos para saber dónde almacenar  los datos
  1. Si la recuperación rápida de los datos no es crítica, almacena los datos en niveles de almacenamiento más lentos, pero más baratos (almacenamiento «en frío»), para que el volumen no repercuta tanto en el coste.
  2. Almacena en niveles de alta velocidad (almacenamiento «en caliente») los datos que se solicitan con más frecuencia o cuya urgencia en la obtención es alta (dependerá de lo importante que sea obtener los datos a tiempo).
  3. Diseña tu solución de datos de forma que la rotación entre los niveles «en caliente» y «en frío» se adapte a tu caso de uso. Esto no sólo le ahorrará costes, sino que también optimizará el rendimiento en la mayoría de los escenarios.

Pasando a la parte más importante, hablamos de los datos que necesita almacenar. Esto dependerá de si tus datos son de calidad o no, por lo que recomendamos leerlo varias veces hasta que quede completamente claro.

12 consejos para saber qué datos hay que almacenar
  1. Almacena los datos no urgentes en dispositivos de gran capacidad y con tiempos de acceso lentos. Estos datos pueden ser referenciados con índices ubicados en dispositivos más rápidos.
  2. En la misma situación que la anterior, comprimir los datos también es una buena idea.
  3. No te preocupes por definir esquemas diferentes según los usuarios de los datos (el caso más común suele ser por razones de privacidad) ya que creará esquemas lógicos a partir de los datos ya guardados.
  4. Estudia las relaciones entre conceptos, ya que la ejecución de una consulta puede implicar la recuperación de muchos datos innecesarios. Intente pensar en las operaciones que se van a realizar con más frecuencia y cree pocas relaciones intermedias entre conceptos relacionados.
  5. Cuanto más datos numéricos almacenes, mejor.
  6. Si categorizas los datos, por ejemplo, a las personas mayores de edad les asignas 1, y a las que no lo son, 0, guarda siempre en algún lugar cómo se han calculado estos valores, almacena también el dato original, en este caso la edad. 
  7. Guarda las fechas y horas de las operaciones y transacciones.
  8. Hay casos en los que pueden faltar datos en tu fuente de datos. Ten en cuenta el valor lógico por defecto para los que faltan.
  9. Conoce la codificación en la que se guardarán tus datos.
  10. Escribe validaciones para prohibir aquellos valores de datos que no tienen sentido. Cuando algunos valores lo vulneren, piensa si debe rechazar la inserción de esos datos, o si debes establecer valores por defecto.
  11. Cuando tengas una gran urgencia por obtener ciertos datos que requieren muchas operaciones computacionalmente costosas, es muy posible que necesites precalcular esos datos y almacenarlos de forma redundante para poder recuperarlos más rápidamente.
  12. El tipo fecha es mucho más lento que el tipo entero, por lo que si no tienes limitaciones de almacenamiento, es preferible tener valores separados para los componentes de fecha y hora (año, mes, hora, etc.) para realizar operaciones sobre datos numéricos en lugar de tipo fecha.
8 Consejos para empezar a recoger datos
  1. Empieza siempre por tus activos y procesos más importantes. No tengas muy en cuenta tus objetivos o KPIs actuales, céntrate en obtener datos de ellos. Puesto que si tus objetivos cambian con el tiempo, tendrás que cambiar por completo el sistema de obtención de datos que tenías hasta el momento ya que tus datos actuales no tendrán valor.
  2. Empieza a extraer datos poco a poco, no intentes crear un gran esquema de datos al principio, empieza poco a poco y ve aumentando tu esquema a medida que te sientas cómodo (sé ágil).
  3. El proceso de ingesta debe ser periódico y metódico. Nos referimos a que la frecuencia con la que se obtienen los datos debe estar estipulada en función del tiempo que se necesita para recopilarlos.
  4. Sé realista, obtener datos hasta tener un proceso automatizado puede ser laborioso, sé consciente de los recursos que tienes disponibles para dedicarlos.
  5. Sigue los formatos estándar, le ahorrará tiempo y dinero.
  6. Haz copias de seguridad periódicas. Siempre pueden producirse errores, por lo que consideramos que es muy importante que crees unas copias de seguridad descentralizadas y redundantes.
  7. Dale importancia a los metadatos (datos que describen los datos), como la marca de tiempo, etc.
  8. Una vez que tengas todo lo anterior, entonces puedes empezar a pensar en tener más datos, por ejemplo, puedes empezar a tener sobre el tiempo de un día concreto (si eso es importante para ti), sobre tu competencia, sobre tu cuota de mercado, etc. Es decir, datos que no forman parte directamente de tu negocio, pero que tienen un impacto en él.

 Importante: Los resultados y beneficios que aportan los datos no se obtendrán hasta un determinado momento. Así que para obtener información relevante, necesitas un mínimo de datos sustanciales (sé constante).

Esperamos que estos consejos te ayuden a sacar el máximo partido a tus datos. No obstante, si todavía no sabes por dónde empezar, póngase en contacto con nosotros y te ayudaremos a hacer que su organización sea “data driven”.

  • por