CDH3 Hadoopで擬似分散モード環境をCentOS6上に作る

擬似分散モードとは1台のマシン上に分散環境を擬似的に構築する事です。


前提条件としてOSから自ホストが名前解決できる事。
DNSが登録できない環境だと 例えば


192.168.0.XX bose999-cent6.XXXXX.co.jp bose999-cent6


等を/etc/hostsに記述しておく。

# su -
# chmod 755 jdk-6u30-linux-x64-rpm.bin 
# ./jdk-6u30-linux-x64-rpm.bin 
# cd /etc/yum.repos.d
# wget http://archive.cloudera.com/redhat/6/x86_64/cdh/cloudera-cdh3.repo
# ls
CentOS-Base.repo  CentOS-Debuginfo.repo  CentOS-Media.repo  cloudera-cdh3.repo
# yum update yum
# yum install hadoop-0.20
# yum install hadoop-0.20-namenode hadoop-0.20-datanode hadoop-0.20-secondarynamenode hadoop-0.20-jobtracker hadoop-0.20-tasktracker
# yum install hadoop-0.20-conf-pseudo
# cd /etc/init.d
# ./hadoop-0.20-namenode start
# ./hadoop-0.20-datanode start 
# ./hadoop-0.20-secondarynamenode start
# ./hadoop-0.20-jobtracker start
# ./hadoop-0.20-tasktracker start


JDK6いれてリポジトリ追加してyumでいれて、
擬似分散モードの設定もRPMで入れて、その後起動の流れ。


この作業の後、


NameNode http://192.168.0.XX:50070/
JobTracker http://192.168.0.XX:50030/


にブラウザつないで確認。