Obsah

Hadoop

Důvody pro Hadoop

Architektura Hadoopu

Typy souborů

Komprese

Rychlost Účinnost Splitovatelnost
GZIP/ZLib
BZip2
LZO
Snappy

Splitovatelnost – kompresní algoritmus vytváří bloky, které lze samostatně dekomprimovat – nutnost pro paralelní zpracování