
Tres obstáculos previos al trabajo del Científico de Datos
3 abril 2017

Una vez que una empresa se ha embarcado definitivamente en la cultura del Big Data, las posibilidades que abre la analítica de datos son inmensas. La convivencia entre analistas de datos y especialistas en el negocio dentro de equipos mixtos supone iniciar un journey que, idealmente, culminará en la apertura de nuevas líneas de negocio. Los resultados no llegan de un día para otro, pero la Ciencia de Datos convierte en factibles hitos que antes parecían inalcanzables.
Ahora bien, antes de embarcarse con plenas garantías en su trabajo, el Científico de Datos debe sortear tres obstáculos previos.
1. Acceso a los datos
Muchas empresas pueden llegar a acumular gran cantidad de datos de sus clientes, pero la naturaleza de sus servicios incluye restricciones relacionadas con la seguridad y la privacidad. Surge entonces un problema del tipo “huevo-gallina”: como condición para dar acceso a los datos, los responsables exigen conocer el valor potencial que el análisis de los datos puede aportar al negocio. Pero por mucho que el analista pueda pontificar al respecto, no es posible demostrar los beneficios reales para la compañía a no ser que se permita dicho acceso a los datos.
¿Cómo escapar de este dilema? Una forma de hacerlo es avanzar mediante modelos escalados que, progresivamente, demuestren al equipo directivo los beneficios que puede aportar la analítica. El acceso a una muestra de los datos permitirá elaborar un modelo que solucione un problema concreto. Un estudio a pequeña escala de clientes específicos, que pueda ayudar a tomar una decisión con repercusión inmediata en la compañía, es un buen punto de partida. Una vez que el directivo compruebe la utilidad del modelo – trasladándolo a decisiones inmediatas-, el primer paso estará dado.
En este escenario, es crucial elegir un problema adecuado, que tenga un impacto visible en el negocio. Y para ello es necesaria la habilidad del analista, su intuición y su conocimiento del negocio. Claro que un modelo construido a partir de una muestra limitada contará con significancia limitada; sin embargo, es un requisito para abrir de par en par las puertas de los datos.
2. Los medios tecnológicos
Superado el primer obstáculo, se presenta el siguiente: disponer de la infraestructura tecnológica necesaria que soporte el acceso a los datos, el análisis y la exploración de resultados.
No se trata de buscar un culpable si dichos medios no están disponibles: simplemente puede que nadie en la organización haya sido consciente del impacto que el análisis de los datos puede tener en el negocio. Pero tampoco hay atajos en este camino: si esta labor no está hecha, alguien tendrá que ocuparse.
Un problema adicional que se presenta a menudo es el de la descentralización de los datos. Con departamentos desagregados y bases de datos dispersas, cada una con sus correspondientes protocolos de acceso y seguridad, el Científico de Datos, en ocasiones con la ayuda de un ingeniero, deberá trabajar en la tarea de agrupar los datos en un único lugar, antes de que pueda siquiera acometer su trabajo.
3. La gestión humana
Una parte de la Ciencia de Datos -como la de cualquier otra ciencia, consiste en la exploración. Y para explorar se requiere una buena dosis de inspiración, y el menor número posible de órdenes estrictas que ahoguen la creatividad.
Pasión, perseverancia y curiosidad son cualidades requeridas en este tipo de labor, y a menudo no compatibles con la rigidez jerárquica. Por eso, los directivos deben ser pacientes y comprensivos, y, siempre dentro de la mayor o menor presión que dictaminan los resultados financieros, conceder al Científico de Datos el tiempo y la libertad necesarios para sacar adelante la investigación. Una vez que se haya conseguido el equilibrio entre lo que es motivante para los empleados y lo que es importante para el negocio, los resultados deberán llegar.
—
Del dato a la decisión… si nada se tuerce
Una vez enfrentado a los datos, el Científico emprende generalmente un proceso escalado. Deberá dedicar una gran parte de su tiempo a limpiar los datos, y después arrancar una ruta que comienza en las muestras pequeñas y que concluirá, si todo va bien, en la extracción de conclusiones útiles a partir de un modelo predictivo.
Si todo va bien… Porque la Ciencia de Datos no es un procedimiento infalible. Como en cualquier proyecto de investigación, no hay certezas absolutas. Por eso, hay que estar preparados para afrontar un posible fracaso, por duro que pueda resultar asimilarlo por las empresas con elevadas expectativas, que muchas veces sencillamente no contemplan la falta de resultados.
En los proyectos en los que se trabaja con grandes bases de datos, no siempre es necesario hacer uso de todos los datos. Por eso es importante escalar: empezar con una base de datos manejable, establecer un diálogo permanente con la persona o departamento más interesada en el proyecto. Y una vez que se obtiene un pequeño insight de hasta dónde se puede llegar, comenzar a escalar.
El camino hasta ese punto se encuentra a veces con carencias relacionadas con la toma de decisiones: hacia dónde orientar la investigación, qué datos utilizar, qué tipo de análisis emplear… Los conocimientos técnicos no garantizan el éxito de proyectos concretos, siempre sujetos a imprevistos que no se contemplan en los centros de formación.
El ratio entre información disponible y las decisiones está muy descompensado hacia el primero. En el proceso de transformar el dato en decisión puede perderse mucho volumen de información, y en ese recorrido interviene la manera de contar el proceso. No se puede transmitir una decisión relevante para el negocio si no se puede respaldar con argumentos sólidos de dónde procede esa conclusión, qué datos se han empleado y qué procesos se han seguido para desgranar esa información y convertirla en ese diamante que es la decisión.
__________________________________________________________________________
Este artículo forma parte del estudio “Científico de Datos: ¿Quién es? ¿Qué hace? ¿Cómo trabaja?”, disponible en Rebel Thinking.
Otros artículos extraídos del estudio:

