Mide y Analiza: la estadística en la analítica web

Analítica y Data Science

Todos tenemos luz y oscuridad en nuestro interior, lo que importa es qué parte elegimos potenciar

Harry Potter y la Orden del Fénix

Uno de los problemas con los que nos encontramos los analistas a la hora de analizar es la cantidad ingente de datos que hemos recogido. Entender qué ha pasado se convierte en un reto importante cuando ¡no hay nada que nos ayude a ver la luz!

Yo suelo usar la estadística (a nivel muy muy básico, ¡no asustarse!) en la metodología que sigo en el análisis, sobre todo para entender muy bien las tendencias, el qué ha pasado e intentar dilucidar por qué.

¿En qué me ayuda la estadística? Bien, una de las primeras cosas que hago al enfrentarme a un sitio web es estudiar el comportamiento de diversas métricas a lo largo del tiempo. Por ejemplo, tomo el dato de visitas al sitio web a lo largo del último año. Incluyo el mismo mes del año anterior para comprobar si la evolución tiene una tendencia positiva o negativa, y obtengo desde excel un gráfico como éste:

De este modo, podemos ver cómo los meses más flojos a nivel de visitas en el sitio web son Junio y Julio, mientras que en Abril y Agosto tenemos los picos más interesantes del periodo. Parece que con respecto al año anterior hemos ido perdiendo fuelle.

Pero, ¿no falta algo? El siguiente paso que realizo después de estudiar la evolución es calcular la progresión. Es decir, el cambio real que se ha producido entre cada mes de 2011 en comparación a lo que pasó en 2010. La fórmula exacta es:

Progresión = valor mes año actual / valor mismo mes año anterior – 1

Se calcula exactamente la progresión para cada uno de los meses a analizar y volvemos a consultar el gráfico:

Al estudiar la progresión, podemos ver las visitas desde una perspectiva distinta a la evolución, puesto que no veremos qué pasa de un mes hacia otro, sino qué meses han funcionado mejor en base a la estacionalidad del producto o servicio que ofrecemos.

En el primer gráfico uno de los meses que más destacaba era noviembre, también abril tenía un pico destacado. Después de mirar la progresión, la atención va más a febrero, octubre y noviembre. Parece que después del verano no se logra remontar el vuelo… ahí es donde hay que analizar más a fondo, empezamos a tener un camino que explorar.

Evolución + Progresión = LUZ

Otras veces lo que tenemos son un montón de variables que suben o bajan a primera vista sin relación aparente. ¿Cómo arrojar luz sobre qué métricas tienen que ver con otras? La regresión lineal nos ayuda ?

Desde Excel únicamente necesitaremos una tabla con los valores de las métricas a estudiar:

La idea es ir combinando variables para saber si existe relación entre sus valores. Es decir, ¿sube la tasa de rebote al subir los visitantes nuevos? ¿Suben los ingresos si suben las visitas desde keywords con nuestra marca? Buscar relaciones entre métricas nos ayudará a reconducir una estrategia, a prevenir problemas mayores, a aprender de lo que estamos haciendo bien, etc…

¿Cómo funciona la regresión lineal? Se basa en el coeficiente R2, que saca la relación lineal entre dos variables. Cuando este coeficiente esté próximo a cero, indica que no hay relación entre las variables. Cuanto menos se acerque a cero, existe relación. Si el valor es positivo, indica que cuando una de las variables sube, la otra también lo hace. Si el valor es negativo, que cuando una de las variables aumenta la otra disminuye. ¡Luz Luz Luz! ?

En el ejemplo, podemos ver cómo el aumento o disminución de los usuarios captados nuevos no influye en los ingresos conseguidos puesto que el coeficiente tiende a cero:

Sin embargo, al comparar los ingresos con la tasa de rebote, podemos comprobar cómo sí que existe una relación, al aumentar los ingresos si la tasa de rebote disminuye. Es decir, en el ejemplo, hay un 95% de ¡Luz! Focalizando esfuerzos en disminuir la tasa de rebote estaremos en el buen camino:

Podemos meternos más en este tipo de análisis de relación y correlación, combinando todas las métricas que se nos ocurra, yo lo automatizo en excel para que las combine según las voy alimentando de Google Analytics y la verdad es que salen conexiones que nunca se nos hubieran ocurrido… al menos a mí.

Finalmente, con la función TENDENCIA de Excel podremos intuir el valor futuro de una métrica teniendo en cuenta sus valores en periodos anteriores:

Si tenemos valores de enero a septiembre y queremos estimar el valor de octubre, usaremos esta función, que nos dará un resultado sobre el que podremos basar nuestra predicción o estimación del valor del siguiente periodo:

Así podremos adelantarnos al tiempo y saber lo que nos espera, tendremos más pistas de por dónde debemos tirar. ¡LUZ! ?

Son conceptos muy básicos de estadística que nos servirán, no para hacer un estudio estadístico profundo, sino para desatascarnos en el análisis de los datos de cara a decidir por dónde podemos empezar a meter mano para optimizar el sitio a analizar.

Para ahondar en cómo estos modelos estadísticos pueden ayudar en el día a día de un análisis web hay ejemplos en estos enlaces:

Regresión y Correlación

Regresión lineal

Correlación

Creo que es muy interesante que, sea cual sea tu experiencia o estudios como analista web, conozcas la existencia de estos conceptos para poder hacer un análisis exhaustivo de las métricas y ver la luz cuando nada parezca tener mucho sentido ?

Menú