Cinco recomendaciones para la integración de datos
Integrar, integrar... y no me refiero a las integrales que muchos de nosotros aprendimos en cálculo, sino a la emocionante —y muchas veces no tanto— tarea de buscar la información de diferentes fuentes de información, darle un formato —utilizable por supuesto— y depurarla. En lo personal considero la integración de la información como la segunda tarea más importante en el análisis de datos; siendo la primera el establecimiento de los objetivos y preguntas clave de negocio que necesitamos responder. Recordemos que son estas preguntas clave de negocio las que nos darán la dirección a seguir y los requerimientos de datos. El análisis como tal dependerá de la calidad de la información y de la calidad de la tabla de salida; ésta última es la que utilizaremos en nuestro ambiente de análisis como por ejemplo SAS o R. En mi carrera profesional he tenido la oportunidad de trabajar con soluciones analíticas como SAS y R; además de soluciones de visualización de datos como SAS Visual Anal