Revoluciona tu estrategia de marketing construyendo un data lake

David Lastra

16 noviembre 2017

171116 gr rebelthinking tv datalake wp 1 2

“Si la única herramienta que tienes es un martillo todo se ve como un clavo” Abraham Maslo

 

Data Lake, Data Driven

 

Una organización Data Driven, se apoya en la tecnología para mejorar sus resultados mediante el análisis y gestión correcta de los datos, con el objetivo de encontrar cambios de valor significativos que puedan ser aplicados de manera ágil en la compañía.

En el marketing digital actual, hay miles de aplicaciones y servicios disponibles para optimizar las diferentes etapas del ciclo de vida del cliente que son de gran utilidad, pero en la mayoría de las organizaciones, cuando se utilizan, la información queda finalmente almacenada en los silos de datos de esas herramientas donde el contacto con el cliente se ha producido. Sistemas de generación de landing pages, tecnologías publicitarias como DMPs, CRMs, Apps móviles, herramientas de marketing automation, servicios de analítica web, bases de datos operacionales, etc. capturan la información y la dejan disponible, completa o parcialmente, para el análisis posterior, generando el desafío de lograr una visión completa del cliente y mejorar la experiencia que se está ofreciendo.

Para realizar un marketing efectivo basado en datos, es necesario que la organización sea dueña de estos datos, recogiéndolos de todas las aplicaciones y canales que se estén utilizando, para poder almacenarla, tratarla, integrarla y gobernarla. Tradicionalmente una manera de resolver esta problemática ha sido construir almacenes de datos (data warehouses,datamarts, bases de datos relacionales), los cuales estaban limitados por la propia tipología de datos estructurados que permitían tratar estas tecnologías, ya que requería del modelado y manipulación previa por parte de los equipos IT internos para poder generar los informes que previamente se habían tenido que definir por las diferentes áreas de negocio.

Con la evolución en los últimos años de las tecnologías de Big Data, impulsadas por el enorme impacto que el mundo digital ha tenido en los negocios, se requiere que la tecnología sea más flexible y ágil para poder responder de manera efectiva a este entorno tan cambiante y con tipologías de datos totalmente heterogéneas según sea la fuente o el canal que se analice.

Para atender a esta necesidad, con sistemas que tengan gran capacidad de almacenamiento para recoger información de diferentes canales, servicios y sistemas internos (canales sociales, marketing automation, analítica web, CRM, ERP, comportamiento mediante fingerprints, medición paid media, call center, etc.) con tipología de datos estructurados y no estructurados, disponibles en tiempo real y/o en procesos batch, consultables en modo lectura, etc. Contamos actualmente con los Data Lakes, que permiten almacenar e indexar cualquier tipo de dato sin necesidad de transformación, abriendo nuevas posibilidades a las organizaciones, sobre todo a marketing y negocio que pueden hacer sus análisis de manera ágil y con total independencia técnica.

Diferencia entre un Data Lake y el tradicional Data Warehouse

captura de pantalla 2017 11 16 16 36 27

Los Data Lakes se suelen implementar en servicios escalables en cloud que tienen menor coste que los tradicionales sistemas Data Warehouse tanto en capacidad de almacenamiento como en procesamiento (AWS, Azure, Bluemix, etc.) permitiendo capturar más cantidad de datos de diferentes fuentes sin necesidad de saber cómo se van a usar esos datos. Esto significa que en un Data Lake podemos tener inicialmente datos y valores que, aparentemente, no aportan mucho pero que, pueden ser enriquecidos con otros conjuntos de datos para sacarles provecho en otros periodos de tiempo según se necesiten.

Un concepto importante, es que tecnológicamente, no compras un Data Lake, una herramienta concreta, sino que hablamos de construir uno, con diferentes servicios y tecnologías, externas e internas, y en este proceso tienen que colaborar diferentes departamentos para identificar los canales y sistemas disponibles de los que se pueda obtener información. Un Data Lake no es un repositorio pasivo dónde se almacenan datos sino que es una plataforma dinámica que evolucionará con el tiempo proporcionando nuevas capacidades de procesamiento de datos y capacidades para obtener más conocimiento de los mismos.

Si los datos son variados y de gran volumen, pueden alojarse e indexarse ​​de forma nativa en grandes plataformas de datos distribuidas como Spark o Hadoop. Si los datos son semi-estructurados o son archivos tipo log, es recomendable usar sistemas de datos NOSQL como Cassandra, CouchDB y Mongo DB, y usar motores de búsqueda para permitir consultas rápidas como Elastic Search o Splunk. Si se van a manejar grandes volúmenes de datos no estructurados, por ejemplo de contenido, deben considerarse otros motores de búsqueda con análisis semántico NLP (procesamiento de lenguaje natural), como el proyecto Open Source de Apache OPEN NL o soluciones de mercado como Attivio, Expert System o Sinequa. Para soluciones en las que se necesita combinar análisis de texto y de imagen es idóneo IBM Watson (Alchemy API). Los Data Lakes pueden combinar cualquiera de estas soluciones descritas dependiendo de la evolución y necesidad de datos a tratar que se vaya necesitando, es esta flexibilidad, lo que realmente los hace tan potentes.

La necesidad de disponer de datos de calidad y un modelo de gobierno sobre ellos no desaparece con los Data Lakes por lo que la limpieza de datos y minería de información sigue siendo igualmente necesaria. Para evitar que un lago de datos acabe siendo un enorme pantano, es recomendable establecer un sistema de rastreo de los datos, para identificar rápidamente el origen y fecha de en la que se produjo la captura de los mismos. Para cuidar la calidad de los datos, excluyendo datos mal formados o superpuestos, se suelen conectar estas soluciones con herramientas de Big Data mediante uso de ETL, para trabajar con datos normalizados y estructurados para ser analizados rápidamente en sistemas de datos relacionales mediante herramientas de visualización o cuadros de mando en tiempo real.

Un Data Lake sirve para muchos casos de uso diferentes, en marketing orientado a datos, permite de inicio estandarizar y unificar términos tan importantes como los “códigos de campaña”, “canal” y definiciones de negocio como «cliente», “lead”, «área de ventas» y «producto» mejorando el modo de medir cada una de las operaciones de marketing que se realicen.

Entre las ventajas principales de usar un Data Lake destacan:

  • Eliminación de la fragmentación. Ofrece una visión unificada de toda la experiencia del cliente, puesto que proporciona una visión integrada de todas las plataformas, silos y canales.
  • Mejorar el conocimiento del cliente y los momentos decisorios a lo largo de su customer journey.
  • Capacidad de generar campañas y procesos de captación con mayor agilidad y autonomía, mediante herramientas que permiten medir y optimizar las inversiones en marketing en tiempo real.
  • Disponer de un sistema propio de almacén de histórico de datos, que permite analizar y establecer modelos predictivos de comportamiento de los clientes.
  • Trazar e identificar unívocamente al usuario desde los diferentes touch points para atribuir el origen de la conversión.
  • Generar un entorno tecnológico propietario con una arquitectura orientada a servicios que permitirá el desarrollo o evolución de nuevas herramientas.
  • Mejorar la inteligencia de negocio, mediante un cuadro de mando dinámico con múltiples orígenes de datos (propios y externos) que permitirá tomar decisiones en tiempo real.
  • Crear un equipo de operaciones de Marketing Data Driven ágil que pueda responder rápidamente a las necesidades del negocio.

 

Aliseda, explotación del conocimiento cliente

 

captura de pantalla 2017 11 16 13 53 13

 

Aliseda Inmobiliaria, es una compañía experta en la gestión de activos inmobiliarios cuyas principales áreas de actuación se centran en el negocio patrimonial, la promoción inmobiliaria, la gestión del suelo y la venta de producto terminado: viviendas a estrenar y de segunda mano.

Su principal apuesta es ofrecer el mejor servicio de atención al cliente, basándose en los principios de transparencia, flexibilidad y agilidad y para ello promueve el continuo desarrollo y optimización de las herramientas necesarias para satisfacer las expectativas de cualquier persona interesada en uno de sus inmuebles.

Para dar respuesta a este reto, Good Rebels les ha ayudado a llevar a cabo un proyecto tecnológico muy ambicioso que:

  • Se basa en tecnología de consumo de datos en tiempo real & Big Data.
  • Amplía el conocimiento de leads y clientes a través de su comportamiento.
  • Identifica las mejores oportunidades en el proceso de flujo comercial mediante scorings.
  • Dota al call center de información personalizada por cliente.
  • Optimiza la inversión del área de Marketing.
  • Mejora la inteligencia de negocio.
  • Aumenta la agilidad y eficiencia de campañas con criterios de segmentación personalizados y en tiempo real.

Para ello ha implantado un sistema de huella digital (Fingerprint), tecnología Big Data para registrar las interacciones que se producen y consumir la información en tiempo real (Cassandra y Storm), marketing automation para lead nurturing (Watson Campaign) y personalización de ofertas, herramientas de analítica y predictivas para la explotación de la información (Pentaho) y un sistema de certificación comercial a través de una APP mobile.

Toda la información que se genera de contactos potenciales, desde su entrada a través de los distintos canales existentes, hasta la gestión de la relación comercial que se establece entre la compañía y la persona interesada en un inmueble durante todo el proceso de compra, se registra en un Data Lake. La centralización de los datos posibilita el desarrollo de sistemas de recomendación para mejorar la experiencia de usuario, el análisis del funnel de conversión para medir la rentabilidad de las acciones de una forma ágil, realizar acciones de comunicación orientadas a las necesidades de cada cliente en tiempo real y disponer de un entorno tecnológico que permite el desarrollo y evolución de nuevas herramientas.