Entradas

Mostrando las entradas de diciembre, 2018

Un poco de analítica: ¿canciones de Timbiriche?

Imagen
    Por Abner Huertas Uno de los análisis que más me ha llamado la atención durante los últimos meses es el de sentimientos; el cual de forma práctica lo que busca es dar una calificación al texto en función de la percepción de las palabras que lo componen.    Para salir un poco de la rutina de los negocios pensé en hacer un análisis curioso: ¿Qué tal analizar letras de canciones en español? ¿Por qué no canciones de Timbiriche?   Vamos a realizar un análisis sencillo de 12 canciones, cuya letra se consigue por internet. Para el análisis utilicé: R como motor analítico y una base de datos pública  —conocida como Lexicon— para calificar sentimientos. En R se utilizaron los paquetes tidytext, dplyr, ggplot2 y purrr.   El objetivo del análisis es responder: ¿qué tan positiva o negativa es la canción? ¿cuáles son las canciones más positivas o negativas? ¿Cuáles son los sentimientos que reflejan las canciones?   Previo a continuar es importante mencionar que la base de datos de s

Una leyenda en analítica: los pañales y las cervezas

Imagen
  «Una leyenda nos cuenta que hace mucho tiempo una empresa de ventas al por menor decidió combinar la información de sus tarjetas de lealtad con su punto de venta. La primera fuente de información proveyó de variables demográficas, la segunda sobre las compras de sus clientes.   Al realizar el proceso de análisis con minería de datos se encontraron varias correlaciones. Algunas obvias como que al comprar tequila también compran limones. Sin embargo, una de las correlaciones se levantó por encima de las demás debido a que era inesperada: los viernes por la noche hombres jóvenes que compran pañales también tienen la predisposición de comprar cerveza.   Al ver estos resultados la empresa decidió mover los pañales cerca de donde estaban las cervezas. Al poco tiempo vio un incremento sustancial en sus ingresos».   El 31 de julio de 2002 se celebró el décimo aniversario del estudio de los pañales y las cervezas; el evento fue patrocinado por Teradata, una división de NCR; en este