Hadoop HDFS Plugin

Logo Apache Hadoop
Bacula Enterprise Hadoop HDFS Plugin umożliwia wykonywanie kopii zapasowych danych przechowywanych w Hadoop Distributed File System (HDFS), który stanowi fundament ekosystemu Big Data Apache Hadoop. Plugin integruje się z HDFS API i WebHDFS, umożliwiając efektywny backup ogromnych zbiorów danych rozproszonych na dziesiątkach lub setkach węzłów klastra Hadoop.

Plugin respektuje architekturę HDFS z podziałem na NameNode (metadane) i DataNodes (dane), wykonując spójne kopie zapasowe zarówno danych jak i metadanych systemu plików. Umożliwia granularne odtwarzanie wybranych katalogów i plików HDFS, a także pełne odtworzenie infrastruktury Hadoop po awarii.

Kluczowe funkcjonalności:

  • Backup danych HDFS przez WebHDFS i HDFS API
  • Backup metadanych NameNode (fsimage, edits)
  • Backup danych rozproszonych na DataNodes
  • Wsparcie dla klastrów Hadoop wielowęzłowych
  • Efektywny backup petabajtowych zbiorów danych
  • Granularne odtwarzanie wybranych plików i katalogów HDFS
  • Obsługa Hadoop 2.x i 3.x
  • Integracja z Kerberos (zabezpieczenie klastra Hadoop)