Apache Hadoop cumple 10 años

Cloudera celebró la semana pasada el 10º aniversario de Apache Hadoop. El 28 de enero de 2006 Doug Cutting creó el código considerado como la “génesis” de Hadoop, un ecosistema de código abierto que cambió, principalmente, la forma en la que las empresas almacenan, procesan y analizan los datos. La principal diferencia con el resto de sistemas tradicionales es que Apache Hadoop permite que se ejecuten múltiples tipos de tareas analíticas en los mismos datos y en el mismo momento.

Apache Hadoop cuenta actualmente con más de 1,7 millones de líneas de código en el core. Además, durante estos 10 años, más de 800 personas han contribuido al desarrollo de este core con un total de más de 12.000 compromisos y más de 25 componentes.

Según Wikipedia, Apache Hadoop es un framework de software que soporta aplicaciones distribuidas bajo una licencia libre. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File System (GFS).

Hadoop es un proyecto de alto nivel Apache que está siendo construido y usado por una comunidad global de contribuyentes mediante el lenguaje de programación Java.

Hadoop consiste básicamente en el Hadoop Common, que proporciona acceso a los sistemas de archivos soportados por Hadoop. El paquete de software The Hadoop Common contiene los archivos .jar y los scripts necesarios para hacer correr Hadoop. El paquete también proporciona código fuente, documentación, y una sección de contribución que incluye proyectos de la Comunidad Hadoop.