Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Následující verze Obě strany příští revize
kj:hadoop-a-hdfs [21.08.2017 18:19]
kj
kj:hadoop-a-hdfs [14.09.2017 13:45]
kj
Řádek 12: Řádek 12:
  
 ==== Architektura Hadoopu ==== ==== Architektura Hadoopu ====
 +
 +{{ :​kj:​arch_hadoop.png?​400| }}
 +
   * HDFS: distribuovaný FS   * HDFS: distribuovaný FS
 +      * velký soubor je rozdělen na 64 MB chunky a třikrát replikován
 +
 +
   * YARN: plánovač úloh a alokátor zdrojů   * YARN: plánovač úloh a alokátor zdrojů
       * Application – alokuje zdroje       * Application – alokuje zdroje
       * Resource Manager – globální správce zdrojů pro cluster. řeknu mu o paměť, RAM, on mi řekne, zda to jde       * Resource Manager – globální správce zdrojů pro cluster. řeknu mu o paměť, RAM, on mi řekne, zda to jde
       * Node Manager – podřízený správce zdrojů na nodu, kouká se, zda je dost místa pro danou operaci       * Node Manager – podřízený správce zdrojů na nodu, kouká se, zda je dost místa pro danou operaci
 +
 +{{ https://​2xbbhjxc6wk3v21p62t8n4d4-wpengine.netdna-ssl.com/​wp-content/​uploads/​2012/​08/​yarnflow1-600x371.png?​400| }}
   * MapReduce   * MapReduce
   * zvěřinec nad tím: Hive, Spark, HBase, Zookeeper (sdílení konfiguračních souborů, komunikace clusterů), Kafka, Flink, Kassandra, Kudu, ...   * zvěřinec nad tím: Hive, Spark, HBase, Zookeeper (sdílení konfiguračních souborů, komunikace clusterů), Kafka, Flink, Kassandra, Kudu, ...
  
-{{ :​kj:​arch_hadoop.png?​400| }}+
  
   * **Name Node** - ukládá metadata   * **Name Node** - ukládá metadata
Řádek 51: Řádek 59:
       * vhodné, pokud se ptám jen na část sloupců       * vhodné, pokud se ptám jen na část sloupců
       * nevhodné pro modifikaci (v Hadoopu netřeba), náročné pro zápis       * nevhodné pro modifikaci (v Hadoopu netřeba), náročné pro zápis
 +      * má metadata až na konci - předtím je ještě nezná, dává smysl
   * SequenceFile - vhodný formát pro hodně malých souborů   * SequenceFile - vhodný formát pro hodně malých souborů
  
kj/hadoop-a-hdfs.txt · Poslední úprava: 18.09.2017 16:16 autor: kj