摘要:
大数据集群伪分布搭建所用架包为jdk-8u144-linux-x64
hadoop-2.7.4
安装虚拟机环境
转载:安装虚拟机环境
虚拟机的安装(Centos7)
搭建Hadoop平台
搭建前的准备
配置主节点名
主节点更名为master
1 | sudo hostnamectl set-hostname master |
配置各节点的静态IP地址并且访问外网
注意DNS1与网关同名才可访问外网
master节点
1 | vi /etc/sysconfig/network-scripts/ifcfg-ens33 |
在文件中更改BOOTPROTO=static
ONBOOT=yes
添加:
1 | IPADDR=192.168.*.* |
配置hosts映射
master节点
1 | vi /etc/hosts |
添加如下映射信息
1 | 192.168.*.* master1 |
关闭防火墙
1.查看防火墙状态
1 | firewall-cmd --state |
2.停止firewall
1 | systemctl stop firewalld.service |
3.禁止firewall开机启动
1 | systemctl disable firewalld.service |
时间同步
命令行输入:
1 | yum install ntp |
下载完成后 命令行输入:
1 | ntpdate -u ntp1.aliyun.com |
然后命令行输入:
1 | date |
创建用户(root下)
1 | sudo useradd -m joker -s /bin/bash |
添加:
1 | joker ALL=(ALL) ALL |
配置ssh无密码访问
生成公钥密钥对
命令行输入:
1 | ssh-keygen -t rsa |
一直按回车直到生成结束
执行结束之后每个节点上的/root/.ssh/目录下生成了两个文件 id_rsa 和 id_rsa.pub
其中前者为私钥,后者为公钥
在主节点上执行
命令行输入:
1 | cd ~/.ssh/ |
安装jdk
主从机都进行该操作
解压JDK :
1 | sudo tar -zxvf /opt/sorftware/jdk-8u144-linux-x64.tar.gz -C /opt/modules/ |
配置环境变量, 编辑profile文件:
1 | sudo vi /etc/profile |
在profile文件末尾添加以下代码:
1 | export JAVA_HOME=/opt/modules/jdk1.8.0_144 |
保存后,使刚才编辑的文件生效:
1 | source /etc/profile |
测试是否安装成功:
1 | java -version |
安装并配置hadoop
安装
解压hadoop:
1 | sudo tar -zxvf /opt/sorftware/hadoop-2.7.4.tar.gz -C /opt/modules/ |
配置环境变量:
1 | sudo vi /etc/profile |
在末尾添加:
1 | export HADOOP_HOME=/opt/modules/hadoop-2.7.4 |
保存后使新编辑的profile生效:
1 | source /etc/profile |
配置
需要配置的文件的位置为/opt/modules/hadoop-2.7.4/etc/hadoop,需要修改的有以下几个文件:
hadoop-env.sh
yarn-env.sh
core-site.xml
hdfs-site.xml
mapred-site.xml
yarn-site.xml
slaves
其中hadoop-env.sh和yarn-env.sh里面都要添加jdk的环境变量
hadoop-env.sh
添加如下代码:export JAVA_HOME=/opt/modules/jdk1.8.0_144
到#The java implemention to use下
yarn-env.sh
添加如下代码:export JAVA_HOME=/opt/modules/jdk1.8.0_144
到#some java parameters下
core-site.xml
1 | mkdir /opt/modules/hadoop-2.7.4/data |
1 | <configuration> |
hdfs-site.xml
1 | cd /usr |
1 | mkdir /usr/dfs/data |
1 | <configuration> |
mapred-site.xml
1 | cp mapred-site.xml.template mapred-site.xml |
1 | <configuration> |
yarn-site.xml
1 | <configuration> |
slaves
修改成:
1 | master1 |
启动
格式化主节点的namenode主节点上进入/opt/modules/hadoop-2.7.4目录然后执行:
1 | ./bin/hadoop namenode -format |
提示:successfully formatted表示格式化成功
启动hadoop
主节点上在hadoop-2.7.4目录下执行:
1 | ./sbin/start-all.sh |
1 | ./sbin/mr-jobhistory-daemon.sh start historyserver |
主节点上jps进程如下:
NameNode
SecondaryNameNode
ResourceManager
jps
DataNode
NodeManager
注:JobHistoryServer (启动命令:mr-jobhistory-daemon.sh start historyserver
)