Big Data: la galaxia de los datos

José Luis Rodríguez

9 julio 2012

Big Data: la galaxia de los datos

Imagen del autor

Grandes datos, megadatos o datos masivos. Todavía no hay acuerdo sobre su denominación en español pero lo cierto es que ya están aquí y son, para muchos, la materia que alimentará la siguiente revolución social y económica de nuestro siglo.

En el ámbito anglosajón nacieron como Big Data y son el resultado de una carrera tecnológica sin precedentes en la que nosotros, casi sin saberlo, también participamos. Hablamos de millones y millones de bytes de información sobre toda clase de fenómenos y actividades -desde las variaciones atmosféricas hasta nuestros patrones diarios de consumo- que se producen, difunden o almacenan a través de medios tan variopintos como un teléfono móvil, una red social o la memoria de una máquina expendedora de refrescos.

¿Qué es lo interesante de estos gigantescos conjuntos de datos? Que su estudio ya no es un privilegio de los grandes laboratorios de supercomputación; que pueden mejorar nuestra comprensión sobre lo que hacemos, lo que somos… y lo que compramos; que pueden ayudarnos a predecir lo que ocurrirá dentro de unos minutos, a paliar los efectos de una catástrofe natural… o, quién sabe, a resolver una crisis económica como la presente.

Hoy son 2,5 zetabytes de información. Esa es la capacidad de almacenamiento de la Tierra o, mejor dicho, la de todos los soportes de datos disponibles en nuestras ciudades, hogares y centros de trabajo, ya sean memorias de ordenador o consolas de videojuegos. Si dispusiésemos ese volumen en unidades de DVD, tendríamos una pila de discos tan larga que cubriría 1,5 veces la distancia hasta la Luna. Pero lo más espectacular no es eso. Lo sorprendente es que esa cifra, generada principalmente en Europa y Norteamérica, se ha producido en apenas los dos últimos años y que cada anualidad, además, crece a un ritmo aproximado del 50 por ciento.

La pregunta es cómo hemos llegado hasta aquí. Para responderla no hace falta fijarse en los cientos y cientos de satélites artificiales que orbitan sobre nuestras cabezas ni en los grandes servidores de información que guardan celosamente compañías globales como Google o Facebook. No tenemos más que recapitular sobre nuestros hábitos diarios más recientes y fijarnos en la gran cantidad de dispositivos incorporados durante este tiempo a nuestras vidas.

Multimedia y movilidad
Imagen de datos.gob.es

Escribimos comentarios en blogs, enviamos por correo electrónico enlaces a artículos de periódicos digitales, compramos libros para eBook en tiendas virtuales y realizamos múltiples trámites de nuestro ayuntamiento o comunidad autónoma por Internet. Todas estas transacciones son información. Y sumadas entre sí pueden convertirse en Big Data o, en otras palabras, aquello que supera la capacidad de captura, almacenamiento, gestión y análisis de datos de las herramientas informáticas tradicionales.

Para llegar a este punto ha sido antes necesario que nos dotáramos de máquinas progresivamente más potentes, desde teléfonos inteligentes, tabletas y ordenadores portátiles, hasta televisores de alta definición y grabadoras de vídeo digital. Sólo en un disco duro de poco más de 450 euros podemos almacenar ya toda la música producida en un año en el mundo.

Más de 5.700 millones personas disponen, actualmente, de teléfono móvil (cuatro quintas partes de la población mundial) y dos de cada diez habitantes del planeta cuentan con su propio smartphone. En 2013 este grupo habrá crecido un 20 por ciento y para el 2014 se espera que la potencia de cálculo de dichos dispositivos supere de forma combinada a la de todas las supercomputadoras existentes, de acuerdo con los pronósticos de la famosa Ley de Moore.

Esos números han disparado, consigo, el de las redes sociales y la Web 2.0. Su uso no hace sino extenderse y se ha desplazado desde el ámbito de los consumidores hasta el día a día interno de las empresas, de forma que nos encontramos ante uno de los hitos que más directamente pueden incidir o inciden ya sobre el Big Data.

Los 900 millones de usuarios activos de Facebook, por ejemplo, invierten más de 9.300 millones de horas en el sitio, tiempo durante el cual lanzan una media mensual de 30.000 millones de contenidos al ciberespacio. You Tube, por su parte, contabiliza cada minuto una subida a sus repositorios del equivalente a 24 horas de vídeo, a una media de 7,5 minutos diarios de información por usuario (con 800 millones de visitantes al mes).

Si bien estas plataformas dominan las preferencias comunicativas de los usuarios más jóvenes, el ritmo de adopción de las mismas es mucho más elevado en los sectores de población adulta. De hecho, según el Instituto Global McKinsey, estos últimos ofrecían ya en 2009 una tasa de introducción en las redes sociales hasta siete veces superior a las de los menores de 34 años. Ello sólo augura que la generación de grandes datos en el espacio 2.0 no hará sino multiplicarse durante el próximo lustro, con las ventajas que su estudio integral o segmentado proporcionará a empresas y administraciones públicas.

Imagen del autor

Pero, con todo, el fenómeno que promete dominar el nuevo mundo de los macrodatos es el llamado Internet de las Cosas, donde cada objeto o elemento cotidiano dispone de un identificador propio conectado en red y capaz de “sentir”, crear y comunicar información. En estos momentos existen unos 30 millones de sensores en todo el planeta dispuestos para captar datos y distribuirlos mediante tecnología RFID, a través de terminales móviles, contadores de energía, vehículos, maquinaria industrial e, incluso, sencillos artículos de consumo como prendas de vestir o entradas para un concierto. Esta cifra, que promete aumentar a un ritmo anual del 30 por ciento, es especialmente importante en ámbitos tales como el transporte, la automoción, la industria, la administración pública y la venta al por menor.

De hecho, hay fabricantes que empiezan a utilizar los datos obtenidos mediante esos sensores para ofrecer servicios post-venta más innovadores, tales como revisiones y tareas de mantenimiento de determinados aparatos antes o justo en el momento de aparecer incidencias en su funcionamiento. Otros, directamente, emplean estos diminutos artilugios para conocer el ciclo de uso y rotación de sus productos. Entre ellos, por ejemplo, encontramos a gigantes internacionales como la española Inditex.

La ciencia de los grandes números ha llegado. Su apuesta en los próximos años será demostrar que la inversión tecnológica, económica y organizativa que requiere es mucho más que un gran dato o una enorme cifra; que nos llevará, como promete, a una nueva y más provechosa revolución humana.

Informes y links de interés

Bringing big data to the enterprise. IBM.
The Big Data Opportunity: Making government faster, smarter and more personal. Policy Exchange.
Big Data: The next frontier for innovation, competition, and productivity. McKinsey Global Institute.
Cramming more components onto integrated circuits (pdf). Gordon E. Moore. Electronics, Volume 38, Number 8, April 9, 1965.
Amendment No. 4 to Forn S-1 Registration Statment. Facebook. April 23, 2012 (pdf). United States Securities and Exchange Commission.
You Tube. Estadísticas.
El reto del “Internet de las cosas”. El País. 17 de mayo de 2007.
Social CRM y Big Data: obligados a entenderse. #TcBlog. 14 de mayo de 2012.
Internet de las Cosas: conectando el mundo real. #TcBlog. 9 de mayo de 2012.
RFID. Wikipedia.
RFID: The best is yet to come! IDC Community Insights. March 28, 2012.