BIG & OPEN DATA

Events

El universo digital de EMC/ICD

2007 - 2011

La consultora tecnológica IDC Corporation (www.idc.com) publicó su primer informe de la información digital almacenada en el mundo en el año y sus predicciones de crecimiento para el año 2010.

Algunos de los datos significativos del resumen ejecutivo del primer informe de 2007 eran los siguientes:

• En 2006, la cantidad de información digital creada, capturada y guardada (replicated) era de 161 exabytes (una información 3 millones de veces la información contenida en todos los libros escritos hasta esa fecha.

• Entre 2006 y 2010 la información que se añadirá anualmente al universo digital se incrementaría desde 161 exabytes a 988 exabytes.

• IDC predecía que en 2010, casi el 70% del universo digital sería creado por los individuos y que la seguridad de la información y la protección de la privacidad serían uno de los temas más preocupantes.

En el primer informe, la tabla de unidades de medida de información digital comenzaba en el Bit, Byte y Kilobyte para terminar en el Zettabyte (ZB) equivalente a 1000 Exabytes; un Exabyte equivale a 1000 Petabytes, 1 Petabyte equivalente a 1.000 Terabytes y 1 Terabyte equivalente a 1.000 Gigabytes.

La era del Petabyte

2008

LLaa La era del Petabyte era del Petabyte era del Petabyte era del Petabyte3 fue el título del artículo publicado en la prestigiosa revista Wired en 2008 y firmada por Chris Anderson, su editor. Este artículo publica un estudio sobre la cantidad de información digital almacenada en el mundo en esas fechas.
Se destaca en el estudio la proliferación de sensores por todas partes, el almacenamiento infinito, nubes de procesadores y se comenta nuestra capacidad para capturar, almacenar y comprender las cantidades masivas de datos (big data) que están cambiando la ciencia, la medición, los negocios y la tecnología. El artículo considera que a medida que nuestras colecciones de hechos y figuras crece, también crecerá la oportunidad de encontrar respuestas a preguntas fundamentales y “… en la era de los grandes datos, más no es sólo más sino que es diferente” (“because the era of big data more isn´t just more. More is different”).

Digital Universe

2008

IDC volvió a publicar su informe en 2008 pero ahora denominado “Digital Universe”6 (El Universo Digital) y ya en esa ocasión las cifras dadas eran: 281 exabytes en 2007 y se preveía para 2011 la cantidad de 1800 exabytes (1,8 ZB) o sea 10 veces la información producida en 2006.

Una de las razones fundamentales para el crecimiento se achacaba al creciente número de cámaras fotográficas y sobre todo el aumento de la revolución de las cámaras independientes y de las cámaras incorporadas a los teléfonos celulares, que consideraban cifras medias de 5 megapixeles. El informe preveía un inimaginable valor de 25 Zettabytes para el año 2020.

Estos números comenzaban a ser astronómicos y difíciles de imaginar por una mente humana; pero si sorprendentes son los datos, mucho más lo era el hecho que destacaba el informe de que la cantidad de datos se duplica aproximadamente cada cinco años. En el año 2007 incluso crecía más rápido la cantidad de datos almacenada, del orden del 60 por ciento.

Pronóstico consultora IDC

2009

Informe que cifraba en 0,8 Zetabytes (1 Zetabyte es a1 billón de Gigabytes)
y pronosticaba que para el año 2020 esta cifra subiría a 35 Zetabytes
(35 billones de Gigabytes) o lo que es lo mismo, esta cantidad se
multiplicaría por 44 en una década. El informe adelantaba que la mitad de
esosdatos residirán en los servidores remotos alojados en la “nube”.

Segundo Informe del Universo Digital

2009

En esta edición, la cifra almacenada en el año 2008 llegó a los 487 de exabytes y daba como dato anecdótico que esta cantidad era el equivalente a 30.000 millones de iPod Touch o 10.000 millones de discos BluRay totalmente cargados, o 162 billones de fotos digitales. Ya en este informe comenzaban a darse datos del impacto de Twitter y otras redes sociales.

Datos en todas partes

2010

Algunos datos con los que se inicia el informe mencionan algunas cifras astronómicas de información que se podían encontrar en la Tierra en las fechas de publicación. Wal-Mart, el gigante de los grandes almacenes de los Estados Unidos, manipula más de 2,5 Petabytes, el equivalente de 167 veces los libros de la Biblioteca del Congreso de América (America´s Library Congress); la red social Facebook aloja 40.000 millones de fotografías y la decodificación del genoma humana implicaba el análisis de 3.000 millones de pares básicos, que tardan 10 años en recolectarse la primera vez que se hizo en 2003, y que hoy se pueden conseguir en una semana.

Otro artículo interesante incluido en el informe, “Clicking for gold”, analiza la forma en que las empresas de Internet rentabilizan los datos de la Web.

The Digital Universe Decade

2010

En él se pronostica que en 2020 el Universo Digital crecería en cantidades inimaginables, y que el crecimiento del año 2009 fue del 63% y que el Universo Digital en 2020 sería 50 veces mayor que en el año 2009.

En este informe se dedica especial atención a la Nube y se proporciona información relevante al modelo Cloud Computing. Se prevé que en el año 2020 una parte muy importante del Universo Digital estará hospedada, gestionada o almacenada en depósitos (repositorios) públicos o privados que se denominan “servicios de la nube”; incluso se vaticinaba que si un byte del Universo Digital no vive en la nube de modo permanente, a lo largo de su vida de una u otra forma pasará por la nube.

El crecimiento previsible para el año 2010 alcanzaría la cifra de 1,2 millones de Petabytes, o sea 1,2 Zettabytes (una unidad de medida hasta ese momento nunca utilizada).

2011 Digital Universe Study: Extracting Value from Chaos

2011

"2011 Estudio Universo Digital: extraer valor de caos"

Las conclusiones más sobresalientes se refieren al hecho de que el volumen de información continúa creciendo a una velocidad espectacular y este crecimiento y los “big data” están transformando todos los aspectos de los negocios y de la sociedad, y controlando los cambios económicos, científicos, tecnológicos y sociales que se están produciendo. Otros aspectos importantes que destaca el estudio se refiere a que la información del mundo se duplica cada dos años y que en 2011 se crearían 1.8 zettabytes, creciendo de un modo más rápido que la conocida Ley de Moore. Las empresas manejarán 50 veces más datos y la cantidad de archivos será 75 veces mayor en la próxima década.

La investigación de IDC muestra que el universo digital, es decir, la información que se crea, captura o replica de manera digital, llegaba en 2007 a 281 exabytes y en 2011 el volumen de información digital que se produciría durante el año debiera ser prácticamente de 1.800 exabytes (1,8 zetabytes), es decir 10 veces lo que se produjo en 2006, que se calculó en 180 exabytes.

LA REVOLUCIÓN DE LOS DATOS ESTÁ CAMBIANDO EL PAISAJE DE LOS NEGOCIOS/THE ECONOMIST

2011

The Economist publicó el 26 de mayo de 201123 y en su reputada sección Schumpeter un excelente artículo sobre Big Data en donde se resalta que la revolución de los datos estaba cambiando el paisaje de los negocios.

El último año (2010), señala The Economist, las personas habían almacenado datos suficientes para rellenar 60.000 Bibliotecas del Congreso de los Estados Unidos. Los 4 mil millones de usuarios de teléfonos celulares (móviles) (12% de los cuales poseían teléfonos inteligentes) se habían convertido por sí solos en flujos de datos. YouTube, por ejemplo, recibía 24 horas de video cada minuto.

Actualidad

2012

La revolución de los datos está impactando en los modelos de negocios y en las industrias establecidas de modo muy importante. Empresas del sector de las ciencias de la salud utilizan programas como Google Health y Microsoft Health Value para permitir a los consumidores seguir el estado de su salud y registrar su tratamiento. Los fabricantes están sufriendo una gran transformación y en algunos casos se están convirtiendo en compañías de servicios ya que todos los numerosos sensores instalados permiten monitorizar sus productos y ver si ellos necesitan reparación antes de que se produzca una avería.

Esta revolución también está cambiando a los gobiernos. Las autoridades de gestión de los impuestos pueden controlar mejor las situaciones de desempleo u ocupación en función de los perfiles de comportamiento de los ciudadanos. Los servicios de salud están minando los datos clínicos con el objeto de hacer un uso más eficiente de las medicinas.