<?xml version="1.0" encoding="utf-8"?>
<!-- generator="FeedCreator 1.7.2-ppt DokuWiki" -->
<?xml-stylesheet href="http://wiki.wladik.net/lib/exe/css.php?s=feed" type="text/css"?>
<rss version="2.0">
    <channel>
        <title>Vladimír Mach kj</title>
        <description></description>
        <link>http://wiki.wladik.net/</link>
        <lastBuildDate>Wed, 15 Apr 2026 01:43:11 +0200</lastBuildDate>
        <generator>FeedCreator 1.7.2-ppt DokuWiki</generator>
        <image>
            <url>http://wiki.wladik.net/lib/tpl/machim/images/favicon.ico</url>
            <title>Vladimír Mach</title>
            <link>http://wiki.wladik.net/</link>
        </image>
        <item>
            <title>kj:databases</title>
            <link>http://wiki.wladik.net/kj/databases?rev=1499691480&amp;do=diff</link>
            <description>*  Stanford course:  &lt;https://lagunita.stanford.edu/login?next=/courses/Engineering/db/2014_1/&gt;
	*  tutorialspoint: &lt;https://www.tutorialspoint.com/sql/&gt;</description>
        <category>kj</category>
            <pubDate>Mon, 10 Jul 2017 14:58:00 +0200</pubDate>
        </item>
        <item>
            <title>kj:git</title>
            <link>http://wiki.wladik.net/kj/git?rev=1499692346&amp;do=diff</link>
            <description>*  If you erase or change some files accidentaly, you can revert it in two steps 


# the files need to be tracked first
git add .
# then the changes can be undone
git reset hard


	*</description>
        <category>kj</category>
            <pubDate>Mon, 10 Jul 2017 15:12:26 +0200</pubDate>
        </item>
        <item>
            <title>Hadoop</title>
            <link>http://wiki.wladik.net/kj/hadoop-a-hdfs?rev=1505744177&amp;do=diff</link>
            <description>Hadoop

	*  vhodné pro: velké soubory (čtení na disku až 100 MB/s, výhody sekvenčního čtení), streamovací přístup
	*  nevhodné pro: spoustu malých souborů (hodně zpomalí rychlost disku, až na třeba 1 MB/s), náhodný přístup

Důvody pro Hadoop</description>
        <category>kj</category>
            <pubDate>Mon, 18 Sep 2017 16:16:17 +0200</pubDate>
        </item>
        <item>
            <title>kj:hadoop</title>
            <link>http://wiki.wladik.net/kj/hadoop?rev=1504190702&amp;do=diff</link>
            <description>*  Připojení
	*  Teorie</description>
        <category>kj</category>
            <pubDate>Thu, 31 Aug 2017 16:45:02 +0200</pubDate>
        </item>
        <item>
            <title>HIVE</title>
            <link>http://wiki.wladik.net/kj/hive?rev=1505742705&amp;do=diff</link>
            <description>HIVE

	*  Snaha přivést SQL do světa Hadoop
	*  Nástroj pro dotazování a manipulaci s daty
	*  Vlastní jazyk HQL (variace na SQL)

Přístup k datům

	*  Přístup k datům je prostřednictvím „klasických DB“ tabulek
			*  Data jsou ukládána v HDFS</description>
        <category>kj</category>
            <pubDate>Mon, 18 Sep 2017 15:51:45 +0200</pubDate>
        </item>
        <item>
            <title>KJ's notes</title>
            <link>http://wiki.wladik.net/kj/index?rev=1503663266&amp;do=diff</link>
            <description>KJ's notes

	*  Databases
	*  Linux
	*  Hadoop
	*  Git
	*  R
	*  Private workspace</description>
        <category>kj</category>
            <pubDate>Fri, 25 Aug 2017 14:14:26 +0200</pubDate>
        </item>
        <item>
            <title>Linux</title>
            <link>http://wiki.wladik.net/kj/linux?rev=1510822582&amp;do=diff</link>
            <description>Linux

Tipy and triky

Seřazení velikostí složek podle velikosti 


du -k * | sort -n | cut -f2 | xargs -d '\n' du -sh


Práva
     soubor                       adresář                           r   čtení souboru                čtení adresáře (výpis obsahu)</description>
        <category>kj</category>
            <pubDate>Thu, 16 Nov 2017 09:56:22 +0200</pubDate>
        </item>
        <item>
            <title>MapReduce</title>
            <link>http://wiki.wladik.net/kj/mapreduce?rev=1505742630&amp;do=diff</link>
            <description>MapReduce

Princip:

	*  MAP
			*  vstupní data ve formátu &lt;KEY1, VALUE1&gt; konvertuje na &lt;KEY2,VALUE2&gt;
			*  často nás KEY1 nezajímá - může být offset souboru

	*  REDUCE
			*  vstupní data ve formátu &lt;KEY2, LIST(VALUE2)&gt; konvertuje na &lt;KEY3,VALUE3&gt;</description>
        <category>kj</category>
            <pubDate>Mon, 18 Sep 2017 15:50:30 +0200</pubDate>
        </item>
        <item>
            <title>kj:pripojeni</title>
            <link>http://wiki.wladik.net/kj/pripojeni?rev=1504190714&amp;do=diff</link>
            <description>*  with Putty and Pagent connect with SSH key - load the private key into the connection, add tunnels (Connection -&gt; SSH -&gt; Tunnels, destination: localhost:####)
	*  then kinit and insert password
	*  on Hadoop server - /home/username
	*  to get to HDFS: commands</description>
        <category>kj</category>
            <pubDate>Thu, 31 Aug 2017 16:45:14 +0200</pubDate>
        </item>
        <item>
            <title>R</title>
            <link>http://wiki.wladik.net/kj/r?rev=1505824098&amp;do=diff</link>
            <description>R

	*  R for Data Science book: &lt;http://r4ds.had.co.nz/&gt;
	*  Legends: &lt;http://www.cookbook-r.com/Graphs/Legends_(ggplot2)/&gt;

Knit R to Word

Návod, jak nastavit vlastní formát wordu a spustit ho v eRku: &lt;http://rmarkdown.rstudio.com/articles_docx.html&gt;</description>
        <category>kj</category>
            <pubDate>Tue, 19 Sep 2017 14:28:18 +0200</pubDate>
        </item>
        <item>
            <title>Spark</title>
            <link>http://wiki.wladik.net/kj/spark?rev=1503065931&amp;do=diff</link>
            <description>Spark

	*  systém pro distribuované výpočty na clusteru
	*  vylepšení původního map-reduce, o 2 řády rychlejší
			*  zpracování v paměti – méně I/O operací, vhodné pro iterativní algoritmy nebo analýzu dat
			*  optimalizace operací před zpracováním</description>
        <category>kj</category>
            <pubDate>Fri, 18 Aug 2017 16:18:51 +0200</pubDate>
        </item>
        <item>
            <title>kj:teorie</title>
            <link>http://wiki.wladik.net/kj/teorie?rev=1503064026&amp;do=diff</link>
            <description>*  Hadoop
	*  MapReduce
	*  HIVE
	*  Spark</description>
        <category>kj</category>
            <pubDate>Fri, 18 Aug 2017 15:47:06 +0200</pubDate>
        </item>
    </channel>
</rss>
