Bacula Enterprise Hadoop HDFS Plugin umożliwia wykonywanie kopii zapasowych danych przechowywanych w Hadoop Distributed File System (HDFS), który stanowi fundament ekosystemu Big Data Apache Hadoop. Plugin integruje się z HDFS API i WebHDFS, umożliwiając efektywny backup ogromnych zbiorów danych rozproszonych na dziesiątkach lub setkach węzłów klastra Hadoop.
Plugin respektuje architekturę HDFS z podziałem na NameNode (metadane) i DataNodes (dane), wykonując spójne kopie zapasowe zarówno danych jak i metadanych systemu plików. Umożliwia granularne odtwarzanie wybranych katalogów i plików HDFS, a także pełne odtworzenie infrastruktury Hadoop po awarii.
Kluczowe funkcjonalności:
- Backup danych HDFS przez WebHDFS i HDFS API
- Backup metadanych NameNode (fsimage, edits)
- Backup danych rozproszonych na DataNodes
- Wsparcie dla klastrów Hadoop wielowęzłowych
- Efektywny backup petabajtowych zbiorów danych
- Granularne odtwarzanie wybranych plików i katalogów HDFS
- Obsługa Hadoop 2.x i 3.x
- Integracja z Kerberos (zabezpieczenie klastra Hadoop)