La inteligencia en Big Data comienza con Intel

Opinión: Mientras el mundo genera 1 petabyte de datos cada 11 segundos, el número de dispositivos conectados es igual a la población mundial actual y se espera que se duplique en 2015.

El número de dispositivos conectados es igual a la población mundial actual y se espera que se duplique en 2015. Este aumento lo impulsan, en gran medida, los miles de millones de sensores en red y sistemas inteligentes, también conocidos como la Internet de las Cosas (IoT, por la sigla en inglés). Debido a la proliferación de dispositivos móviles, tales como teléfonos inteligentes y tabletas o lectores y sensores de identificación por radiofrecuencia (RFID), las personas y las máquinas están produciendo datos a tasas exponenciales.

De hecho, Intel estima que el mundo genera 1 petabyte de datos cada 11 segundos, lo que equivale a 13 años de vídeo de alta definición. El término Big Data se refiere a esta explosión de datos, que se caracteriza por su volumen, variedad y velocidad, y que ofrece enriquecer nuestras vidas gracias a nuevos descubrimientos científicos, modelos de negocio y experiencias de consumo.

Expandiendo la cartera de software para hacer avanzar el análisis de los Big Data

La percepción de Intel es que cada individuo y organización en el mundo debe ser capaz de liberar la inteligencia disponible en los grandes volúmenes de datos. La compañía tiene como objetivo abordar las cuestiones de costo, complejidad y confidencialidad asociadas a la gestión, el almacenamiento y la manutención de la seguridad de big data.

Intel está abordando estas cuestiones mediante plataformas de gestión de datos abiertas y software de análisis, incluyendo Intel Distribution del software Apache Hadoop* (Intel® Distribution) e Intel Enterprise Edition para el software Lustre*.

  • Intel Distribution del software Apache Hadoop – Hadoop es un entorno de código abierto para almacenar y procesar grandes volúmenes de datos diversos en un clúster escalable de servidores. Intel Distribution es el primero en proporcionar un cifrado completo con soporte de Intel® AES New Instructions en el procesador Intel® Xeon®. Al incorporar el soporte para el cifrado basado en silicio (hardware) del Hadoop Distributed File System*, las organizaciones son capaces de analizar de forma más segura sus conjuntos de datos sin comprometer el desempeño. Las optimizaciones realizadas para las redes y las tecnologías de IO en la plataforma de procesador Intel Xeon también permiten nuevos niveles de desempeño. Analizar un terabyte de datos, lo que anteriormente llevaría más de 4 horas para el procesamiento completo, ahora se puede hacer en 7 minutos gracias a la combinación del procesamiento de datos por parte del hardware de Intel e Intel Distribution.
  • Intel Enterprise Edition para el software Lustre – Lustre es un sistema de archivos paralelo y distribuido de fuente abierta y una tecnología clave de almacenamiento que vincula datos y permite un acceso de gran rapidez. Intel Enterprise Edition es compatible con Lustre e incluye herramientas de gestión, así como un nuevo adaptador para Intel Distribution. La combinación de Intel Distribution e Intel Enterprise Edition permite que Hadoop se ejecute sobre Lustre, mejorando significativamente la velocidad con la que se puede acceder a los datos y procesarlos. Esto les permite a los usuarios acceder a los archivos de datos directamente desde el sistema de archivos global a tasas más rápidas y acelera el tiempo de análisis, proporcionando un uso más productivo de los recursos de almacenamiento, así como una gestión del almacenamiento más simple.

Intel se ha comprometido a devolver las mejoras de código realizadas tanto a Apache Hadoop como a Lustre a la comunidad de código abierto. El objetivo es ofrecer a la industria una base mejorada desde la cual se puedan expandir los límites de la innovación para mostrar la oportunidad de transformación de los grandes volúmenes de datos.

Simplificar la Internet de las Cosas para maximizar el potencial de los Big data

Según IDC*, en 2015 más de 15 mil millones de dispositivos estarán conectados a la Internet, lo que acelerará rápidamente las oportunidades para la Internet de las Cosas (IoT, por la sigla en inglés)1. A medida que estos dispositivos se conectan y producen datos, están generando una nueva ola de big data en sectores como la automatización de la fabricación, la energía y el transporte.

El análisis de punta a punta define cómo estos miles de millones de sensores en red y sistemas inteligentes se conectarán a lo largo de los próximos años. Hoy en día las aplicaciones a menudo se refieren al monitoreo de una sola máquina y envían una alerta cuando algo va mal. Sin embargo, a medida que muchas más máquinas se conecten unas a otras en la nube, hay oportunidades de monitorear no sólo una máquina, sino también sistemas completos. Por ejemplo, redes de sistemas basados en la tecnología de Intel, llamadas sincrofasores, están desplegándose en la red eléctrica para resolver algunos de los mayores desafíos enfrentados por las empresas de electricidad. El análisis en tiempo sincronizado de la enorme cantidad de datos recogida por estos sensores de la red les proporciona a los operadores de servicios públicos una perspectiva en tiempo real del desempeño y la salud de la red eléctrica.

Con el fin de realizar plenamente estos tipos de ganancias, la tecnología tiene que ser automatizada y de fácil implementación. Al proporcionar una plataforma estandarizada y abierta para análisis avanzados desde el dispositivo a la nube, Intel tiene como objetivo liberar la inteligencia disponible en big data con el fin de enriquecer nuestras vidas a través de los nuevos descubrimientos científicos, modelos de negocio y experiencias de consumo.

Impulsando la innovación en los Big Data

Las inversiones, encabezados por Intel Labs, están impulsando la investigación académica en plataformas de cómputo intensivas en datos, aprendizaje automático por parte de máquinas, algoritmos paralelos, visualización y arquitectura de computadoras. Intel ha creado un Centro de Ciencia y Tecnología Intel (ISTC, por la sigla en inglés) de Big Data. Está hospedado por el Computer Science and Artificial Intelligence Laboratory (CSAIL) del Massachusetts Institute of Technology (MIT). El objetivo de este centro es fomentar nuevas experiencias de uso intensivo de datos que aceleren el ritmo de los descubrimientos a través de campos como la ciencia, la medicina y la industria.

Intel también ha lanzado GraphBuilder, un software beta y abierto que ayuda a los científicos en la industria y la academia a desarrollar nuevas aplicaciones mediante la construcción de gráficos que esquematicen relaciones dentro de los datos. Además, Intel continúa invirtiendo en investigación y capital para hacer avanzar el ecosistema de los Big Data. Intel Labs está a la vanguardia de la investigación analítica avanzada, que incluye el desarrollo del Intel® Graph Builder para software Apache Hadoop*, una biblioteca para la representación de grandes conjuntos de datos en gráficos para ayudar a visualizar las relaciones entre los datos.

Intel Capital continúa haciendo importantes inversiones en tecnologías disruptivas para el análisis de Big Data, incluyendo 10gen de la empresa MongoDB y el proveedor de soluciones para el análisis de Big Data Guavus Analytics.

Ilustración:  Maksim Kabakou © / Shutterstock.com


Únase a la conversación

Contacto | Diario TI es una publicación de MPA Publishing International Ltd., Reino Unido. © Copyright 1997-2022