Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
kj:hive [21.08.2017 18:01]
kj
kj:hive [18.09.2017 15:51]
kj
Řádek 9: Řádek 9:
   * Přístup k datům je prostřednictvím „klasických DB“ tabulek   * Přístup k datům je prostřednictvím „klasických DB“ tabulek
       * Data jsou ukládána v HDFS       * Data jsou ukládána v HDFS
-        * externí tabulky+        * externí tabulky ​- rozdíl od managed jen při ''​drop table''​
         * managed tabulky         * managed tabulky
   * Tabulka je celý adresář   * Tabulka je celý adresář
Řádek 32: Řádek 32:
   * Load data into - to samé co mv na Linuxu   * Load data into - to samé co mv na Linuxu
       * takže nekontroluje schéma, což se projeví u selectů       * takže nekontroluje schéma, což se projeví u selectů
 +
 +  * DROP TABLE vymaže metadata a data 
 +      * při mazání externí tabulky data v tabulce nejsou smazána z FS
  
   * virtuální sloupce ​   * virtuální sloupce ​
-      * ''​INPUT__FILE__NAME'' ​- jméno vstupního souboru pro úlohu mapperu +      * %%INPUT__FILE__NAME%% - jméno vstupního souboru pro úlohu mapperu 
-      * ''​BLOCK__OFFSET__INSIDE__FILE'' ​- současná globální pozice souboru+      * %%BLOCK__OFFSET__INSIDE__FILE%% - současná globální pozice souboru
  
 ==== Partitioning a bucketing ==== ==== Partitioning a bucketing ====
kj/hive.txt · Poslední úprava: 18.09.2017 15:51 autor: kj