H

Hadoop

¿Qué es Hadoop?

Hadoop es el ecosistema open source pionero del big data, basado en HDFS (almacenamiento distribuido) y MapReduce (procesamiento paralelo), junto a herramientas como Hive, HBase, Pig o YARN. Diseñado para procesar volúmenes masivos de datos en clústeres de servidores commodity, fue durante años el estándar de la analítica a gran escala. Aunque hoy convive y compite con plataformas más modernas como Spark o lakehouses cloud, sigue muy presente en grandes corporaciones y entornos on-premise. Lo utilizan data engineers, arquitectos de datos y administradores de plataformas big data. En 2026 mantiene relevancia en banca, telecomunicaciones y administración pública, con ofertas estables aunque menos crecientes que las plataformas cloud nativas.

Formaciones que enseñan Hadoop(13)