Instalação da Distribuição Yahoo! do Hadoop

Preparação

Instale os pré-requisitos: ssh (servidor e cliente), rsync, java 1.6.x, ant. Faça o download da distribuição Yahoo do Hadoop e extraia em, por exemplo, /home/hadoop/yahoo, de maneira que ele contenha o subdiretório bin.

Instalação

$ cd /home/hadoop/yahoo
$ ant
$ ant examples

Modo Pseudo-Distribuído

Processos diferentes podem simular diferentes nós em um só computador. Muito útil para desenvolver aplicações. Siga os passos da documentação da Apache.

Configure seu JAVA_HOME em conf/hadoop-env.sh (echo $JAVA_HOME pode te ajudar).

Inicialização

Apenas uma única vez, execute:

$ bin/hadoop namenode -format

Sempre que for usar o Hadoop, inicie-o com:

$ bin/start-all.sh

Teste

$ echo 'Olá, mundo! Tchau, mundo!' >/tmp/wordcount.txt
$ cd /home/hadoop/yahoo
$ bin/hadoop dfs -put /tmp/wordcount.txt /user/seu_login/
$ bin/hadoop jar build/hadoop-*-examples.jar wordcount wordcount.txt output
$ bin/hadoop dfs -cat output/*
Olá,    1
Tchau,  1
mundo!  2
cat: Source must be a file.

Finalizando

bin/stop-all.sh

WikiLinux: YahooHadoop (last edited 2010-02-27 04:09:48 by CaduSantos)