Data Scientist: el trabajo más prometedor de la próxima década

17 · 05 · 2017

 

 

España ya es una potencia mundial en Ciencia de Datos

Según un estudio de la consultora Good Rebels (antes Territorio creativo), la profesión de Científico de Datos será una de las más prometedoras y buscadas de la próxima década. El estudio, en el que han participado empresas como Google, BBVA, Telefónica, y reputados profesionales de esa disciplina en el mundo académico, como Felipe Ortega, de la Universidad Rey Juan Carlos, o Esteban Moro, de la Carlos III, analiza las capacidades y herramientas que debe reunir este perfil, así como el alcance potencial de su trabajo.

En el mundo, España es ya el octavo país del mundo por número de profesionales de esta especialidad, y todos los expertos entrevistados afirman que la demanda será exponencial. Sólo en Estados Unidos, en los próximos tres años se necesitará cubrir unos doscientos mil puestos de trabajo relacionados con el análisis de datos, así como un millón y medio de profesionales capaces de extraer conclusiones útiles a partir de ellos.

¿A qué se debe el aumento de la demanda de este perfil profesional?

La respuesta está en la competitividad: para una empresa media del ranking Fortune 1000, una mejora de sólo el 10% en la accesibilidad de los datos resultará en más de 60 millones de dólares de ingresos netos adicionales. Y los pequeños comercios que hagan pleno uso del potencial de los datos podrían aumentar sus márgenes operativos hasta en un 60%, según diversas fuentes. Otras cifras dejan clara la necesidad de incluir expertos en la recogida, gestión y análisis de los datos: de acuerdo con información proporcionada por el MIT, menos del 0,5% de todos los datos que se generan son analizados a día de hoy; y, según EMC, para el año 2020 se crearán 1,7 megas de información por segundo y ser humano.

Un volumen que evidencia la necesidad de profesionales formados específicamente para encontrar en los datos patrones reveladores que puedan tener un impacto real en el negocio, desde agilizar procesos y encontrar respuestas a cuestiones estratégicas vitales para el negocio, relacionadas con ahorro de tiempo y costes, al desarrollo de nuevos productos, optimización de ofertas y toma de decisiones más rápidas y precisas.

España, una potencia mundial en Data Science

Los expertos coinciden en que España está a la altura de los países punteros en ciencia de datos. No faltan profesionales altamente cualificados, ni startups especializadas en el tratamiento de Big Data que destacan entre las más avanzadas del mundo. La oferta académica es cada vez más extensa, tanto en centros educativos públicos como privados. Felipe Ortega, cofundador del Data Science Lab del centro de investigación CETINIA y director del Máster en Data Science de la Universidad Rey Juan Carlos,  y Estaban Moro, director del Master de Data Science y Big Data de AFI, y profesor visitante en el MIT (Massachussets Institute of Technology), coinciden en que “el nivel profesional es tan alto que no es descabellado pensar en España como una potencia mundial en Data Science”. El problema es que excelentes profesionales están emigrando para desarrollar su carrera en otros países. Los altos salarios atraen a los profesionales a lugares como California, “aunque una mayor concentración no sea sinónimo de mayor nivel”.

Ambos académicos señalan que el problema de la ciencia de datos en España no es la preparación de los especialistas, sino algunos de los males endémicos que arrastran la organización del trabajo en las empresas españolas: “la agilidad en los tiempos de implantación de los proyectos no es comparable a Estados Unidos, donde se encuentran muchas menos trabas burocráticas. Igualmente, existe todavía un gap entre academia y empresa: falta dinamismo a la hora de integrar el trabajo de un científico en el ámbito de los negocios”, subraya Felipe Ortega.

¿Qué hace un científico de datos? ¿Qué formación tiene?

Según Según Esteban Moro, “las tareas principales de un Científico de Datos se resumen en identificar los datos, curarlos, analizarlos, visualizar los resultados y comunicarlos. Debe poseer una formación técnica en programación, administración de datos, estadística y minería de datos. Sin descuidar la capacidad de centrarse en la generación de valor para la empresa”. El científico de datos se configura así como un híbrido entre programador, analista, comunicador y consejero. Con dominio de disciplinas estadísticas, tecnológicas, matemáticas y de arquitectura de datos; sin olvidar las habilidades empáticas, el conocimiento del negocio y la capacidad de comunicación. Una combinación extremadamente potente… y muy difícil de encontrar, porque la demanda es cada vez mayor, y los profesionales escasean.

Para Felipe Ortega, no es indispensable que el Científico de Datos provenga de disciplinas como las Matemáticas, la Estadística, la Física o las Ciencias Exactas. Algunos Científicos de Datos provienen de campos como las Telecomunicaciones, las Ingenierías o la Informática, e incluso de áreas aparentemente lejanas como Comunicación, Económicas, Finanzas o Biomedicina: “el científico debe ser una persona curiosa, creativa, innovadora, incluso desafiante, capaz de plantearse el status quo imperante. Y por eso es tan decisiva su actitud. Debe ser capaz, a partir de datos y evidencias empíricas, de extraer información que no es evidente, y presentarla de manera comprensible a sus interlocutores. Es tanto el conocimiento que ya existe que tampoco resulta sencillo generar conocimiento nuevo, en forma de cualquier algoritmo o modelo que ayude a mejorar el rendimiento del negocio. Enfrentarse a esos desafíos, además de una sólida formación técnica, requiere de enormes dosis de pasión y motivación”. Para Ortega, los profesionales españoles, en tanto que latinos, cuentan con un plus frente al resto del mundo: el de la creatividad, entendida como la capacidad de buscar soluciones alternativas que nadie más ha imaginado para resolver un problema. Y eso encaja y complementa la parte de empatía, la de aplicar una parte de arte –la otra es ciencia- a la resolución de problemas.

El proceso de selección del científico de datos: un enfoque disruptivo

Para ello, en España muchas empresas han incorporado ya la figura del Científico de Datos. Pero para esta profesión no sirven los procesos de selección tradicionales. Compañías como Facebook, Amazon, Google o Microsoft lideran la vanguardia del uso empresarial de la Ciencia de Datos, y sirven como referencia a organizaciones de todo tipo de sectores para entender tanto el perfil profesional que están contratando como el tipo de trabajo que desempeñan. Según Fuencisla Clemares, colaboradora del estudio y actual directora general de Google España, es muy importante valorar la capacidad de reciclaje, de crecer y aprender en un entorno siempre cambiante, puesto que no se sabe qué a qué retos se va a enfrentar este tipo de perfil en escenarios de medio plazo a dos o tres años.

Los problemas del Científico de Datos en las organizaciones tradicionales

La Analítica de Datos se emplea en la industria de Telecomunicaciones desde hace al menos 20 años. También la Banca lleva años utilizando Business Intelligence, al igual que todas las grandes empresas líderes de sus respectivos sectores. El problema, según Según Richard Benjamins, actual Chief Data Officer en Axa y Director de Business Intelligence en Telefónica en el momento del estudio, es que “lejos de ser una práctica transversal, la Analítica de Datos se ha aplicado a menudo sólo en departamentos concretos, principalmente en Marketing, Redes y Conocimiento del Cliente. No ha existido una cultura corporativa puesta al servicio de los datos, que se han gestionado de manera descentralizada y desorganizada. Los especialistas se encuentran con barreras que complican enormemente su trabajo”.

Para Marcelo Soria, socio de Tramontana.co y anterior Vicepresidente de BBVA Data & Analytics, “el abaratamiento de los costes de computación, la mayor disponibilidad de datos y la mayor conectividad entre éstos aumentan las oportunidades de encontrar patrones o potenciales casuísticas. En instituciones con enormes repositorios históricos, agrupar y procesar los archivos de datos requiere de un colosal esfuerzo; pero una vez completado el trabajo se traduce en mejoras de los procesos internos, la gestión de las personas o el trato con el cliente. El trabajo del Científico de Datos culmina con el alumbramiento de nuevas oportunidades de negocio a partir del examen exhaustivo de los datos.”

El mayor problema al que se enfrenta este tipo de perfil pasa por una cuestión cultural: el respaldo científico detrás de las recomendaciones del Científico de Datos debe abrirse paso entre los procesos tradicionales de toma de decisiones, basados en la experiencia o en otro tipo de indicadores, tan simples en ocasiones como una hoja de cálculo. Los expertos entrevistados coinciden en que no es extraño ignorar las aportaciones del Científico de Datos, ya que pueden situar a quien las recibe en el compromiso de mejorar sus resultados, o en la tesitura de que los datos desmonten decisiones largamente basadas en intuiciones o percepciones erróneas.

¿Quién está empleando mejor la Ciencia de Datos en España? La realidad del Científico de Datos en nuestro país

Tres son los sectores que lideran la implantación de la Ciencia de Datos en España: la Banca, las Telecomunicaciones y el Turismo. En general, son las grandes compañías las que más recursos están invirtiendo en Ciencia de Datos: entidades como Santander, BBVA, Telefónica, Bankinter, Sabadell, La Caixa, Amadeus, Kayak, etc. Pero no son las únicas. Empresas de tamaño mucho más modesto están aplicando Ciencia de Datos de forma muy creativa e innovadora, con un reconocimiento a escala mundial de su trabajo. Dos ejemplos:

Carto 

Fundada en Madrid en 2012, originalmente como CartoDB. Su herramienta más popular es Carto Builder, que permite a los entusiastas de la visualización construir mapas interactivos a partir de datos geolocalizados, sin necesidad de conocimientos de programación. Con más de 1.400 clientes, 200.000 usuarios registrados y oficina en Nueva York, sus objetivos se centran en ofrecer a grandes corporaciones una herramienta de optimización de decisiones y predicción de tendencias de consumo.

Stratio

Fundada también en 2012, a partir de una predecesora, Paradigma. Stratio desarrolla plataformas y productos a partir de tecnologías Big Data, como Cassandra, Apache Stark y desarrollos propios. Los clientes que utilizan sus soluciones de procesamiento en tiempo real proceden de Banca, Seguros, Viajes o Retail. Más de 25 especialistas en arquitecturas Big Data trabajan en la sede central de Stratio en Madrid, que también tiene sucursal en Palo Alto (California).

Business case BBVA: Commerce 360

¿Qué es lo que más interesa a mis clientes? ¿Qué día vende más mi competencia? ¿Venden más caro o más barato que yo? ¿En qué horario vendo más? ¿Dónde viven mis compradores? ¿Cuál es su sexo, edad, cuánto gastan en cada compra?

Cualquier negocio desearía conocer las respuestas a estas y similares preguntas. Las grandes y medianas empresas pueden hacerlo destinando recursos al Business Intelligence, pero es más difícil en el caso de comerciantes independientes o tiendas de barrio.

Es por eso que BBVA ha desarrollado Commerce360, una herramienta que quiere poner el Business Intelligence al alcance de cualquier negocio. A partir de datos agregados y anónimos de pagos con tarjetas de BBVA, la aplicación extrae indicadores relacionados con el sector y el perfil de clientes que compran en una determinada zona.

Commerce360 es una herramienta para retailers, donde utilizando nuestra información de pagos con tarjetas podemos dar a un comercio su actividad económica, su dinámica de compras, con información sociodemográfica de cómo son sus clientes, edades, sexo, dónde y cuándo compran, comparándolo con los comercios agregados que son su competencia, otros comercios que están en la zona que son del mismo tipo de actividad”, explica Marcelo Soria, promotor de la iniciativa.

De esta forma, comerciantes que se dejaban guiar por la intuición u otros métodos tradicionales tiene acceso a una herramienta analítica que les permite conocer la procedencia de sus clientes, medir su fidelidad, estudiar sus características demográficas e identificar a los clientes de más valor. “Nos parece una línea muy interesante para democratizar el acceso al dato, a la inteligencia basada en el dato. Esto es el futuro del retail”, concluye Soria.

Business Case II. Smart Steps, de Telefónica

SmartSteps es un programa de geomarketing desarrollado por Telefónica a partir de datos procedentes de su red de telefonía móvil. Los datos se agregan y se extrapolan de manera anónima para extraer información sobre tendencias o patrones en el comportamiento de los usuarios en un área determinada.

El proyecto captura miles de millones de datos procedentes de la red móvil de Telefónica durante los 365 días del año, 24 horas al día. Estos datos se cruzan con diferentes indicadores sociodemográficos y de movilidad (residencia, modos de transporte, edad) que permiten ofrecer a las empresas una segmentación precisa basada en los movimientos de sus potenciales clientes.

Smart Steps puede tener aplicaciones en cualquier sector en el que el movimiento y el conocimiento del perfil del usuario sean importantes, industrias como viajes y transportes, turismo o publicidad exterior. Por ejemplo, los comerciantes locales podrían saber si los participantes en una fiesta como San Fermín son habituales o esporádicos, de dónde proceden, dónde pernoctan, el tiempo que dura su visita, etc., y con todo ello adecuar su oferta comercial.

Pero también es útil en proyectos públicos, ya que conocer los patrones de movimiento de las personas permite mejorar la gestión del tráfico de las ciudad, ajustar el transporte público o analizar la necesidad de construir nuevas infraestructuras. En 2014, el programa se utilizó para estimar las zonas de Londres más propensas a la delincuencia: el algoritmo generado acertó en un 70% con la distribución geográfica de los delitos.

Anexo I: Las habilidades técnicas de un Científico de Datos

El trabajo del Científico de Datos se basa en la combinación de tecnología, creatividad y datos. Probablemente existe un tronco común en sus calificaciones y desempeños, pero según pase el tiempo, el perfil se irá diversificando en múltiples ramas y especializaciones.

En síntesis, las cuatro disciplinas en las que el Científico de Datos debe desenvolverse con fluidez son:

  • Estadística / Matemáticas: debe ser alguien capaz de analizar bases de datos, construir modelos, hacer previsiones estadísticas y distinguir lo que es representativo de lo que no. Para ello debe contar con una sólida formación matemática que le permita controlar tanto modelos supervisados bajo técnicas predictivas (Data Mining, Machine Learning) como modelos no supervisados de segmentación. Previamente a esa modelización, debe manejar todas las técnicas matemáticas de pre-procesamiento del dato,  y una vez construido el modelo, queda la evaluación. En definitiva, debe estar familiarizado con el conjunto de técnicas que permiten construir y evaluar un modelo predictivo, y ser capaz de aplicar la lógica estadística en lenguajes de programación.
  • Tecnología: como requisito para la transformación de los datos en conocimiento, el Científico de Datos debe entender las necesidades tecnológicas del negocio y saber cómo implementarlas. El diseño de algoritmos es clave en la transformación de datos, y requiere de dominio de múltiples lenguajes informáticos, así como un completo manejo de bases de datos. Es muy importante dominar la automatización, ya que muchos procesos se repiten en un ordenador mientras el científico trabaja en refinar o calibrar el modelo.
  • Analítica de negocio: el Científico de Datos debe hablar el idioma corporativo, entender los objetivos del negocio, la industria en la que opera y los procesos que impulsan los beneficios y el crecimiento de la empresa. Sólo de esta forma será capaz de discernir qué problemas son factibles de ser resueltos mediante el tratamiento de los datos, y sólo conociendo el funcionamiento del negocio podrá trasladar el análisis de los datos hasta insights y recomendaciones valiosas para la empresa. Sin un conocimiento más o menos profundo del entorno empresarial, la mera cualificación técnica puede derivar en rechazo al “techie” o en dificultades de comprensión, o bien situarle en incómodas situaciones ofreciendo respuestas obvias.
  • Comunicación: el Científico de Datos tendrá que presentar en algún momento los resultados de su trabajo – no basados en la experiencia sino en su labor analítica- a profesionales, frecuentemente directivos con capacidad de tomar decisiones, con amplia experiencia de negocio pero sin formación técnica, y hacerlo sin perder en rigor ni exactitud. Para ello debe poseer la capacidad de divulgar de forma sencilla y de establecer un diálogo al nivel de sus diferentes interlocutores. Es muy importante que el resultado de un proceso analítico sea comprensible por cualquier cargo directivo de la empresa, lo que puede abarcar desde un ingeniero a un especialista en social media.

Habilidades más allá de la técnica

Lo ideal es que las anteriores capacidades se complementen con una serie de habilidades personales, para formar un conjunto (a veces, sólo utópico) en el que la especialización se fusiona con las cualidades humanas.

  • Creatividad, que dé un sentido diferente al análisis gracias a la capacidad de emplear nuevos métodos para recopilar, interpretar y analizar los datos. La tecnología en sí no es diferencial, desde el momento en que los mismos programas están disponibles para cualquier organización. Es por eso que la trascendencia del know-how es vital: las herramientas pueden ser las mismas para todos, las mentes que las manejan, no. Añadiendo inteligencia se deshace la uniformidad tecnológica, convirtiendo los resultados que ofrece una solución de software – tal vez los mismos que maneja la competencia – en únicos.
  • Intuición: la capacidad de decantarse por una u otra vía para llegar a una solución resulta extremadamente importante. Los expertos destacan la importancia de aplicar un componente de arte a un proceso de trabajo técnico que suele encadenar una secuencia fija (tratamiento de los datos, curación, modelización, etc.), pero que requiere de una chispa intuitiva para discriminar qué pasos son los adecuados en cada momento del análisis crítico.
  • Flexibilidad: Los mecanismos de prueba y error permiten valorar y escoger una u otra opción con el trabajo ya en marcha, complementando –o incluso rectificando- las decisiones tomadas antes de iniciar el proyecto. Los modelos matemáticos no son únicos, sino que se agrupan en cajas de herramientas que engloban diferentes técnicas. Por eso se requiere agilidad para decantarse por una u otra herramienta o técnica de análisis, en función de la estructura de los datos, la información disponible, etc. Y eso puede suponer una carencia para los profesionales formados en la teoría pero con escasa soltura en la práctica.
  • Curiosidad: entendida como la capacidad de plantear preguntas, de comprender lo que se le solicita y vislumbrar el camino correcto a adoptar. La curiosidad es fundamental para estar a la última en cuanto a técnicas y artes, para actualizarse constantemente. En última instancia,  permitirá extraer inferencias significativas de los datos.
  • Empatía. Aunque su trabajo sea fruto de horas y horas pasadas delante del ordenador, el Científico de Datos no es un lobo solitario. El factor humano debe estar presente en su día a día, en el sentido de que su trabajo depende de la colaboración con otros departamentos, y es imposible sacarlo adelante sin cooperación. Acostumbrado a la movilidad entre proyectos y áreas, el reto consiste en establecer un diálogo fluido con otras partes de la organización. Además, en ocasiones deberá comunicar a clientes o a sus superiores resultados que no son de su agrado, lo que refuerza la importancia del trato personal.
  • Pragmatismo. Por último, de nada sirve todo el análisis teórico si no viene acompañado de una repercusión práctica. Toda la capacidad técnica sirve de poco si el Científico de Datos no es capaz de integrarse en un equipo, de convertir todo su potencial analítico en un resultado al servicio de la empresa o de otros grupos de trabajo. Por eso, es vital la capacidad de trasladar el análisis de los datos a insights o acciones con una incidencia directa en el negocio.

 

Para más información, consulta el estudio completo aquí.

 

 

Sobre Good Rebels

Good Rebels es una compañía, agencia y consultora, que construye futuro allí donde confluyen personas, marcas y tecnología. Su misión es cambiar radicalmente la relación de las empresas con los consumidores, sus empleados y la sociedad. Para ello, ayudan a sus clientes a anteponer a las personas como factor clave de competitividad, desde 6 oficinas repartidas entre Reino Unido Europa y Latinoamérica. Nuestro trabajo actual abarca más de 60 clientes en 9 países.

Good Rebels es, desde el 17 de enero de 2017, el nombre oficial de la compañía fundada en 1997 bajo la denominación de Territorio creativo.


Para más información:

comunicacion@goodrebels.com

 

Comparte +

Suscríbete a nuestros artículos

Suscríbete a #Rebelthinking y mantente al día de las últimas tendencias digitales, una selección de los mejores artículos de Rebel Thinking, así como nuestros últimos estudios y nuestra newsletter mensual.

He leído y acepto las condiciones de uso y la política de privacidad y cookies