Cómo evaluar el trabajo del Científico de Datos

GoodRebels

10 abril 2017

roi ds web 1

Una vez que un proyecto relacionado con la Ciencia de Datos ha tenido el suficiente recorrido dentro de una organización, llega el momento de plantear la medición de los resultados del trabajo del Científico de Datos. ¿Cómo hacerlo?

En primer lugar, hay que tener en cuenta el horizonte temporal: los beneficios nunca se ven a corto plazo. El científico desarrolla un modelo predictivo, que se ejecuta o no en función de si es aceptado por la dirección. Después, las técnicas de aprendizaje automático aún se ejecutarán sobre el modelo creado, con el objetivo de mejorar la precisión.

Para los responsables de los equipos es importante insistir en la aplicación práctica del trabajo. Especialmente en las grandes empresas, es importante procurar que los algoritmos no se queden en bellas teorías. La responsabilidad del Científico de Datos puede darse oficialmente por concluida una vez ha completado la construcción de su modelo, pero la responsabilidad personal se extiende, aún a riesgo de resultar plomizo, hasta que el modelo se ejecuta.

Luego viene la espera de resultados. Los modelos no son infalibles: algún parámetro clave puede haber quedado fuera, bien sea porque se ha introducido alguna variable equivocada que altera el resultado o bien porque el equipo no ha captado las sutilezas del negocio. También puede fallar la ejecución: el insight puede ser bueno, pero no se lleva a la práctica de modo correcto.

La calidad del algoritmo no es la única vara con que se mide el trabajo del Científico de Datos. Entre sus competencias se incluye cierta labor comercial, en el sentido de tratar con el cliente, explicarle qué ha encontrado, orientarle sobre qué hacer con sus datos, siempre utilizando esas habilidades de comunicación que el Científico -o algún miembro de su equipo- debe atesorar. De esta labor puede extraerse otro tipo de valoración.

Por último, recordemos una vez más la importancia del factor humano. La Ciencia de Datos no es una caja negra rodeada de misterio. Los Científicos de Datos no son oráculos, ni sus palabras profecías: el algoritmo puede hacer una determinada predicción, pero la opción de trasladar o no ese insight al negocio, con todas las consecuencias que pueda llevar asociadas, depende en última instancia de la persona que toma la decisión. De ahí la importancia de la parte humana en todo el proceso.

La ética: el necesario complemento de la ciencia

Los datos son un material altamente sensible. Y en una industria en el que la materia prima es tan delicada, la confianza resulta esencial. Es por eso que el trabajo del Científico de Datos conlleva un fuerte compromiso ético, en el sentido de que debe garantizar un uso responsable del activo que se le ha entregado. En una sociedad cada vez más digitalizada donde cada individuo deja rastros inconscientes e involuntarios, sería posible invadir la libertad de cualquier persona simplemente empleando los conocimientos adecuados y unos servidores potentes. Pero nadie desea que eso suceda.

El compromiso ético, además de sensato, es tremendamente necesario en una Sociedad de la Información que se puede enfrentar a peligros de los cuales no es plenamente consciente todavía: vigilancias masivas, ausencia de intimidad, pérdida de datos a gran escala… Por eso, es obligación del Científico de Datos trabajar con transparencia, explicar de manera sencilla y accesible qué y cómo desempeña su trabajo, para superar ese halo de magia negra o de amenaza contra la privacidad que muchos pueden asociar con el Big Data. A poca gente le interesa conocer los entresijos de un algoritmo, pero sí quieren un esbozo del camino que siguen los datos.

Una forma de garantizar este uso ético de los datos es trabajar en proyectos abiertos, Open Data, en los que cualquiera puede acceder a los datos, aportando de alguna manera conciencia y utilidad social. Por ejemplo, en el banco BBVA se han puesto en marcha varios de estos proyectos, dedicados a mejorar la calidad de vida de los ciudadanos, o a optimizar la eficiencia en las ciudades mediante un uso inteligente de la información.

Abrir los datos, devolver algo a la sociedad, constituirse en una plataforma de datos agregados para que otros los utilicen en la creación de valor, en proyectos vanguardistas en los que el altruismo reemplaza a la búsqueda de beneficios. Ese es el compromiso ético que muchos Científicos de Datos han adoptado para salvaguardar el buen nombre de su especialidad.

______________________________________________________________________

Este artículo forma parte del estudio “Científico de Datos: ¿Quién es? ¿Qué hace? ¿Cómo trabaja?”, disponible en Rebel Thinking.

Otros artículos extraídos del estudio: