第2章Hadoop集群搭建

Imagemap

hide

第2章Hadoop集群搭建

hide

任务2.1安装及配置虚拟机

hide

创建Linux虚拟机

leaf

使用WMWare Workstation

leaf

或者其它方式创建的虚拟机

hide

hide

vi /etc/sysconfig/network-scripts/ifcfg-ens33
IPADDR=192.168.137.133
GATEWAY=192.168.137.2
NETMASK=255.255.255.0
DNS1=192.168.137.2

leaf

ifcfg-ens33在不同机器上可能不同,有可能是ifcfg-eth0

leaf

IPADDR根据本机网络修改

leaf

GATEWAY根据本机网络修改

leaf

DNS1根据本机网络修改

hide

远程连接虚拟机

leaf

hide

hide

修改显示主机名

leaf

hostnamectl set-hostname master

hide

修改网络主机名

hide

vi /etc/sysconfig/network

leaf

HOSTNAME=master

hide

使用主机名生效

leaf

systemctl restart network

hide

leaf

hide

leaf

说明:替换下面这些IP和名字后在命令行执行这些echo命令

leaf

echo '' > /etc/hosts
echo '10.255.10.65 c65 c65.centos.com' >> /etc/hosts
echo '10.255.10.175 c175 c175.centos.com' >> /etc/hosts
echo '10.255.10.214 c214 c214.centos.com' >> /etc/hosts
echo '10.255.10.222 c222 c222.centos.com' >> /etc/hosts

hide

关闭防火墙

leaf

systemctl status firewalld

leaf

systemctl stop firewalld

leaf

systemctl disable firewalld.service

hide

hide

leaf

yum -y install ntp

hide

检查ntp服务

leaf

systemctl status ntpd

hide

任务2.2安装Java

hide

Linux下安装Java

hide

安装java的jdk

hide

方式二：通过scp复制jdk

leaf

ssh 10.255.10.31
--如果有提示密码，输入：root
scp -r /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64 10.255.10.145:/usr/lib/jvm/
--如果有提示yes/no,输入：yes
--如果有提示密码，输入：root

hide

hide

leaf

预期结果最后一行可能包含如下路径:
/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre
或
/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.312.b07-1.el7_9.x86_64/jre

hide

hide

leaf

预期结果:
[root@c31 yum.repos.d]# java -version
openjdk version "1.8.0_322"
OpenJDK Runtime Environment (build 1.8.0_322-b06)
OpenJDK 64-Bit Server VM (build 25.322-b06, mixed mode)
[root@c31 yum.repos.d]#

hide

hide

方式一：通过yum安装

hide

leaf

yum install -y java-1.8.0-openjdk-devel-1.8.0.322.b06-1.el7_9.x86_64

hide

方式二：通rpm安装

leaf

sftp上传:\\10.255.10.50\public\soft\java\jdk-8u321-linux-x64.rpm 到虚拟机的\root

leaf

leaf

rpm -ivh jdk-8u321-linux-x64.rpm

hide

任务2.3搭建Hadoop完全分布式集群

hide

安装hadoop3.3.1

hide

解压安装包

leaf

cd /root/hadoop

hide

tar -zxf hadoop-3.3.1.tar.gz -C /usr/local

leaf

说明:该解压过程可能需要较长时间,耐心等待

hide

在/usr/local/hadoop-3.3.1/etc/hadoop目录下修改配置

leaf

cd /usr/local/hadoop-3.3.1/etc/hadoop

hide

vi ./core-site.xml

hide

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9864</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-3.3.1/tmp</value>
</property>
<property>
   <name>hadoop.native.lib</name>
   <value>false</value>
   <description>Should native hadoop libraries, if present, be used.
   </description>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./hadoop-env.sh

leaf

说明:在文件上方空白行处添加如下添加如下两行,注意Java_home路径参考java -verbose命令

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre

leaf

export HADOOP_HOME=/usr/local/hadoop-3.3.1

hide

vi ./hdfs-site.xml

hide

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///data/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///data/hadoop/hdfs/data</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:9868</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./mapred-site.xml

hide

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>master:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master:19888</value>
</property>
<property>
<name>yarn.app.mapreduce.am.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
<name>mapreduce.map.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
<name>mapreduce.reduce.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./yarn-site.xml

hide

<configuration>


<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>${yarn.resourcemanager.hostname}:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>${yarn.resourcemanager.hostname}:8030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>${yarn.resourcemanager.hostname}:8088</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.https.address</name>
<value>${yarn.resourcemanager.hostname}:8090</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>${yarn.resourcemanager.hostname}:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>${yarn.resourcemanager.hostname}:8033</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/data/hadoop/yarn/local</value>
</property>
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>/data/tmp/logs</value>
</property>
<property>
<name>yarn.log.server.url</name>
<value>http://master:19888/jobhistory/logs/</value>
<description>URL for job history server</description>
</property>
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>2048</value>
</property>
<property>
<name>yarn.scheduler.minimum-allocation-mb</name>
<value>128</value>
</property>
<property>
<name>yarn.scheduler.maximum-allocation-mb</name>
<value>2048</value>
</property>
<property>
<name>mapreduce.map.memory.mb</name>
<value>512</value>
</property>
<property>
<name>mapreduce.reduce.memory.mb</name>
<value>1024</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>2</value>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./yarn-env.sh

leaf

说明:在文件上方空白行处添加如下：

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre

hide

leaf

说明:删除已有的localhost这行，然后添加本集群中所有slave从机名，如下：

leaf

hide

vi ./hadoop-env.sh

leaf

说明:在刚才添加的export行后添加如下四行内容:

leaf

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=root
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HADOOP_SHELL_EXECNAME=root

hide

修改linux系统配置文件profile并使生效

hide

vi /etc/profile

leaf

说明:在文件最下方export行后添加如下：

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre
export HADOOP_HOME=/usr/local/hadoop-3.3.1
export PATH=$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$PATH:$JAVA_HOME/bin

leaf

source /etc/profile

hide

验证hadoop相关配置是否生效

hide

leaf

说明：如果显示如下内容说明hadoop配置生效
[root@c31 ~]# hadoop version
Hadoop 3.3.1
Source code repository https://github.com/apache/hadoop.git -r a3b9c37a397ad4188041dd80621bdeefc46885f2
Compiled by ubuntu on 2021-06-15T05:13Z
Compiled with protoc 3.7.1
From source with checksum 88a4ddb2299aca054416d6b7f81ca55
This command was run using /usr/local/hadoop-3.3.1/share/hadoop/common/hadoop-common-3.3.1.jar

hide

克隆虚拟机

hide

复制文件(所有从机)

leaf

说明:针对从机还没有配置的情况才需要复制如下内容,以c32为例

leaf

scp -r /usr/lib/jvm c32:/usr/lib/
scp -r /usr/local/hadoop-3.3.1/ c32:/usr/local
scp /etc/profile c32:/etc/profile

hide

在从机上生效 /etc/profile

leaf

说明:使用crt切换到从机,然后执行以下命令

leaf

source /etc/profile

hide

启动关闭集群

hide

格式化主机的NameNode

leaf

cd /usr/local/hadoop-3.3.1/bin/
./hdfs namenode -format

hide

启动集群命令

leaf

说明:启动命令只需要在master上执行

leaf

cd /usr/local/hadoop-3.3.1/sbin/

leaf

leaf

./start-yarn.sh

hide

./mr-jobhistory-daemon.sh start historyserver
or
mapred --daemon start historyserver

leaf

说明:使用jps查看若有以下进程说明启动正常

leaf

11571 JobHistoryServer

hide

停止集群命令

leaf

说明:启动命令只需要在master上执行

leaf

cd /usr/local/hadoop-3.3.1/sbin/

leaf

leaf

leaf

./mr-jobhistory-daemon.sh stop historyserver
or
mapred --daemon stop historyserver

hide

hide

在虚拟机上安装Hadoop2.x

hide

leaf

yum install java-1.7.0-openjdk

hide

leaf

/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.261-2.6.22.2.el7_8.x86_64/jre

hide

leaf

yum install -y java-1.7.0-openjdk-devel.x86_64

hide

leaf

说明:替换下面这些IP和名字后在命令行执行这些echo命令

leaf

echo '' > /etc/hosts
echo '10.255.10.65 c65 c65.centos.com' >> /etc/hosts
echo '10.255.10.175 c175 c175.centos.com' >> /etc/hosts
echo '10.255.10.214 c214 c214.centos.com' >> /etc/hosts
echo '10.255.10.222 c222 c222.centos.com' >> /etc/hosts

hide

下载Hadoop v2.10.1

hide

创建子目录 hadoop

leaf

cd /root
mkdir hadoop
cd hadoop

hide

在hadoop子目录中下载

leaf

wget https://dlcdn.apache.org/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz

leaf

或 wget http://10.255.10.50/file/hadoop-2.10.1.tar.gz

hide

安装 Hadoop2.10.1

hide

解压安装包

leaf

cd /root/hadoop

hide

tar -zxf hadoop-2.10.1.tar.gz -C /usr/local

leaf

说明:该解压过程可能需要较长时间,耐心等待

hide

在/usr/local/hadoop-2.10.1/etc/hadoop目录下修改配置

leaf

cd /usr/local/hadoop-2.10.1/etc/hadoop

hide

vi ./core-site.xml

hide

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:8020</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/var/log/hadoop/tmp</value>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./hadoop-env.sh

leaf

说明:在文件上方空白行处添加如下添加如下两行,注意Java_home路径参考java -verbose命令

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.261-2.6.22.2.el7_8.x86_64/jre

leaf

export HADOOP_HOME=/usr/local/hadoop-2.10.1

hide

vi ./hdfs-site.xml

hide

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///data/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///data/hadoop/hdfs/data</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:50090</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./mapred-site.xml

hide

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>master:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master:19888</value>
</property>
<property>
<name>yarn.app.mapreduce.am.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
<name>mapreduce.map.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
<name>mapreduce.reduce.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./yarn-site.xml

hide

<configuration>


<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>${yarn.resourcemanager.hostname}:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>${yarn.resourcemanager.hostname}:8030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>${yarn.resourcemanager.hostname}:8088</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.https.address</name>
<value>${yarn.resourcemanager.hostname}:8090</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>${yarn.resourcemanager.hostname}:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>${yarn.resourcemanager.hostname}:8033</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/data/hadoop/yarn/local</value>
</property>
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>/data/tmp/logs</value>
</property>
<property>
<name>yarn.log.server.url</name>
<value>http://master:19888/jobhistory/logs/</value>
<description>URL for job history server</description>
</property>
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>2048</value>
</property>
<property>
<name>yarn.scheduler.minimum-allocation-mb</name>
<value>128</value>
</property>
<property>
<name>yarn.scheduler.maximum-allocation-mb</name>
<value>2048</value>
</property>
<property>
<name>mapreduce.map.memory.mb</name>
<value>512</value>
</property>
<property>
<name>mapreduce.reduce.memory.mb</name>
<value>1024</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>2</value>
</property>
</configuration>

leaf

注意master要改为本集群的master名

hide

vi ./yarn-env.sh

leaf

说明:在文件上方空白行处添加如下：

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.261-2.6.22.2.el7_8.x86_64/jre

hide

leaf

说明:删除已有的localhost这行，然后添加本集群中所有slave从机名，如下：

leaf

hide

vi ./hadoop-env.sh

leaf

说明:在刚才添加的export行后添加如下四行内容:

leaf

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=root
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HADOOP_SHELL_EXECNAME=root

hide

修改linux系统配置文件profile并使生效

hide

vi /etc/profile

leaf

说明:在文件最下方export行后添加如下：

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.261-2.6.22.2.el7_8.x86_64/jre
export HADOOP_HOME=/usr/local/hadoop-2.10.1
export PATH=$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$PATH:$JAVA_HOME/bin

leaf

source /etc/profile

hide

验证hadoop相关配置是否生效

hide

leaf

说明：如果显示如下内容说明hadoop配置生效
[root@c65 sbin]# hadoop version
Hadoop 2.10.1
Subversion https://github.com/apache/hadoop -r 1827467c9a56f133025f28557bfc2c562d78e816
Compiled by centos on 2020-09-14T13:17Z
Compiled with protoc 2.5.0
From source with checksum 3114edef868f1f3824e7d0f68be03650
This command was run using /usr/local/hadoop-2.10.1/share/hadoop/common/hadoop-common-2.10.1.jar
[root@c65 sbin]#

hide

克隆虚拟机

hide

复制文件(所有从机)

leaf

说明:针对从机还没有配置的情况才需要复制如下内容,以目标机器c175为例

leaf

scp /etc/hosts c175:/etc/hosts
scp -r /usr/lib/jvm c175:/usr/lib/
scp -r /usr/local/hadoop-2.10.1/ c175:/usr/local
scp /etc/profile c175:/etc/profile

hide

在从机上生效 /etc/profile

leaf

说明:使用crt切换到从机,然后执行以下命令

leaf

source /etc/profile

hide

启动关闭集群

hide

格式化主机的NameNode

leaf

cd /usr/local/hadoop-2.10.1/bin/
./hdfs namenode -format

hide

启动集群命令

leaf

说明:启动命令只需要在master上执行

leaf

cd /usr/local/hadoop-2.10.1/sbin/

leaf

leaf

./start-yarn.sh

hide

./mr-jobhistory-daemon.sh start historyserver

leaf

说明:使用jps查看若有以下进程说明启动正常

leaf

11571 JobHistoryServer

hide

停止集群命令

leaf

说明:启动命令只需要在master上执行

leaf

cd /usr/local/hadoop-2.10.1/sbin/

leaf

leaf

leaf

./mr-jobhistory-daemon.sh stop historyserver

hide

在笔记本VM上安装Hadoop3.x

hide

安装及配置虚拟机

hide

wmware安装与Linux安装

leaf

安装WMWare Workstation10，注册

hide

配置wmware的虚拟网络

leaf

编辑->虚拟网络编辑器

hide

添加网络->选择Nat模式->NAT设置

leaf

网关:192.168.137.2

leaf

选中:将主机虚拟适配器连接到此网络
选中:使用本地DHCP服务将IP地址分配给虚拟机

leaf

子网IP:192.168.137.0,子网掩码:255.255.255.0

hide

在WMWare上创建虚拟机

hide

创建master主机

leaf

选择默认的:典型

leaf

下一步，选择安装程序光盘映像文件->浏览->前面下载的文件:
CentOS-7-x86_64-Minimal-2009.iso

leaf

下一步，选中Linux操作系统，CentOS64位

leaf

下一步，设置虚拟机名称:CentOS_Hadoop3.x_master,选择位置

leaf

下一步，最大磁盘48G，将虚拟磁盘存储为单个文件

leaf

完成设置，开始安装

hide

远程连接虚拟机

hide

leaf

crt工具安装

leaf

crt工具的配置与连接虚拟机

leaf

以下linux操作如无说明均在crt里操作

hide

hide

修改显示主机名

leaf

hostnamectl set-hostname master

hide

修改网络主机名

hide

vi /etc/sysconfig/network

leaf

HOSTNAME=master

leaf

systemctl restart network

hide

leaf

说明:替换下面这些IP和名字后在命令行执行这些echo命令

leaf

echo '' > /etc/hosts
echo '192.168.137.100 master master.centos.com' >> /etc/hosts
echo '192.168.137.101 slave1 slave1.centos.com' >> /etc/hosts
echo '192.168.137.102 slave2 slave2.centos.com' >> /etc/hosts
echo '192.168.137.103 slave3 slave3.centos.com' >> /etc/hosts

hide

leaf

yum -y install ntp

hide

虚拟机安装Hadoop集群

hide

配置主机master

hide

下载安装hadoop3.3.1

leaf

mkdir /root/hadoop
cd /root/hadoop
wget https://mirrors.aliyun.com/apache/hadoop/core/hadoop-3.3.1/hadoop-3.3.1.tar.gz
tar -zxf hadoop-3.3.1.tar.gz -C /usr/local

hide

配置主机hadoop3.3.1

hide

在/usr/local/hadoop-3.3.1/etc/hadoop目录下修改配置

leaf

cd /usr/local/hadoop-3.3.1/etc/hadoop

hide

vi ./core-site.xml

leaf

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9864</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-3.3.1/tmp</value>
</property>
<property>
   <name>hadoop.native.lib</name>
   <value>false</value>
   <description>Should native hadoop libraries, if present, be used.
   </description>
</property>
</configuration>

hide

vi ./hadoop-env.sh

leaf

说明:在文件上方空白行处添加如下添加如下两行,注意Java_home路径参考java -verbose命令

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre

leaf

export HADOOP_HOME=/usr/local/hadoop-3.3.1

hide

vi ./hdfs-site.xml

leaf

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///data/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///data/hadoop/hdfs/data</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:9868</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>

hide

vi ./mapred-site.xml

leaf

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>master:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master:19888</value>
</property>
<property>
<name>yarn.app.mapreduce.am.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
<name>mapreduce.map.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
<property>
<name>mapreduce.reduce.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
</property>
</configuration>

hide

vi ./yarn-site.xml

leaf

<configuration>


<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>${yarn.resourcemanager.hostname}:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>${yarn.resourcemanager.hostname}:8030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>${yarn.resourcemanager.hostname}:8088</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.https.address</name>
<value>${yarn.resourcemanager.hostname}:8090</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>${yarn.resourcemanager.hostname}:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>${yarn.resourcemanager.hostname}:8033</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/data/hadoop/yarn/local</value>
</property>
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>/data/tmp/logs</value>
</property>
<property>
<name>yarn.log.server.url</name>
<value>http://master:19888/jobhistory/logs/</value>
<description>URL for job history server</description>
</property>
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>2048</value>
</property>
<property>
<name>yarn.scheduler.minimum-allocation-mb</name>
<value>128</value>
</property>
<property>
<name>yarn.scheduler.maximum-allocation-mb</name>
<value>2048</value>
</property>
<property>
<name>mapreduce.map.memory.mb</name>
<value>512</value>
</property>
<property>
<name>mapreduce.reduce.memory.mb</name>
<value>1024</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>2</value>
</property>
</configuration>

hide

vi ./yarn-env.sh

leaf

说明:在文件上方空白行处添加如下：

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre

hide

leaf

说明:删除已有的localhost这行，然后添加本集群中所有slave从机名，如下：

leaf

slave1
slave2
slave3

hide

vi ./hadoop-env.sh

leaf

说明:在刚才添加的export行后添加如下5行内容:

leaf

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=root
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HADOOP_SHELL_EXECNAME=root

hide

修改linux系统配置文件profile并使生效

hide

vi /etc/profile

leaf

说明:在文件最下方export行后添加如下：

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre
export HADOOP_HOME=/usr/local/hadoop-3.3.1
export PATH=$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$PATH:$JAVA_HOME/bin

leaf

source /etc/profile

hide

验证hadoop相关配置是否生效

hide

leaf

说明：如果显示如下内容说明hadoop配置生效
[root@c31 ~]# hadoop version
Hadoop 3.3.1
Source code repository https://github.com/apache/hadoop.git -r a3b9c37a397ad4188041dd80621bdeefc46885f2
Compiled by ubuntu on 2021-06-15T05:13Z
Compiled with protoc 3.7.1
From source with checksum 88a4ddb2299aca054416d6b7f81ca55
This command was run using /usr/local/hadoop-3.3.1/share/hadoop/common/hadoop-common-3.3.1.jar

hide

克隆从机slave

hide

从master克隆出slave

hide

主机master关机

leaf

leaf

wmware左侧树图->右击主机master->管理->克隆->虚拟机当前状态->创建完整克隆,选择存放目录

hide

端口配置参考

hide

hide

core-default.xml

leaf

hdfs://master:9864

hide

hdfs-default.xml

leaf

dfs.namenode.secondary.http-address 0.0.0.0:9868 The secondary namenode http server address and port.

leaf

dfs.namenode.secondary.https-address 0.0.0.0:9869 The secondary namenode HTTPS server address and port.

leaf

dfs.datanode.address 0.0.0.0:9866 The datanode server address and port for data transfer.

leaf

dfs.datanode.http.address 0.0.0.0:9864 The datanode http server address and port.

leaf

dfs.datanode.ipc.address 0.0.0.0:9867

leaf

dfs.namenode.http-address 0.0.0.0:9870

leaf

dfs.datanode.https.address 0.0.0.0:9865 The datanode secure http server address and port.

leaf

dfs.namenode.https-address 0.0.0.0:9871

leaf

dfs.namenode.backup.address 0.0.0.0:50100 The backup node server address and port. If the port is 0 then the server will start on a free port.

leaf

dfs.namenode.backup.http-address 0.0.0.0:50105

leaf

dfs.journalnode.rpc-address 0.0.0.0:8485

leaf

dfs.journalnode.http-address 0.0.0.0:8480

leaf

dfs.journalnode.https-address 0.0.0.0:8481

leaf

dfs.balancer.address 0.0.0.0:0

leaf

dfs.mover.address 0.0.0.0:0

leaf

dfs.storage.policy.satisfier.address 0.0.0.0:0

hide

mapred-default.xml

leaf

mapreduce.jobhistory.address 0.0.0.0:10020 MapReduce JobHistory Server IPC host:port

leaf

mapreduce.jobhistory.webapp.address 0.0.0.0:19888 MapReduce JobHistory Server Web UI host:port

leaf

mapreduce.jobhistory.webapp.https.address 0.0.0.0:19890

leaf

mapreduce.jobhistory.admin.address 0.0.0.0:10033

hide

yarn-default.xml

leaf

yarn.nodemanager.webapp.https.address 0.0.0.0:8044

leaf

yarn.sharedcache.admin.address 0.0.0.0:8047

leaf

yarn.sharedcache.webapp.address 0.0.0.0:8788

leaf

yarn.sharedcache.uploader.server.address 0.0.0.0:8046

leaf

yarn.sharedcache.client-server.address 0.0.0.0:8045

leaf

yarn.nodemanager.amrmproxy.address 0.0.0.0:8049

leaf

yarn.router.webapp.address 0.0.0.0:8089 The http address of the Router web application. If only a host is provided as the value, the webapp will be served on a random port.

leaf

yarn.router.webapp.https.address 0.0.0.0:8091

leaf

hide

修改配置文件

hide

leaf

修改主机名：
例如：master 、slave1、slave2
(1) 修改显示主机名：hostnamectl set-hostname master
(2) 修改网络主机名：
vi /etc/sysconfig/network ~ 编辑配置文件
HOSTNAME=master ~ 将网络主机名改为master

hide

leaf

编辑/etc/hosts
192.168.137.133 master master.centos.com
192.168.137.134 slave1 slave1.centos.com
192.168.137.135 slave2 slave2.centos.com

leaf

新增slave3
192.168.137.136 slave3 slave3.centos.com

hide

配置用户权限

leaf

11.5 /hadoop-3.3.0/sbin下修改 start-dfs.sh、stop-dfs.sh、hadoop-env.sh 顶行添加下面代码，
HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=root
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
HADOOP_SHELL_EXECNAME=root ~ 这行只给 hadoop-env.sh 加上。否则启动时会因为权限不足而失败，这四个配置文件默认路径。

leaf

11.6 修改 start-yarn.sh、stop-yarn.sh 文件：
修改 start-yarn.sh、stop-yarn.sh 文件，添加下面的配置：
配置文件路径：hadoop-3.3.0/sbin
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=root
YARN_NODEMANAGER_USER=root

hide

messagebox_warning

配置workers批量启动脚本

leaf

11.8 配置workers批量启动脚本：
从name node 服务器上配置批量启动脚本，在这一台主机上通过脚本一键启动所有服务器。
3.0以后 slaves 改名为 workers ，在hadoop-3.3.0/etc/hadoop下，编辑workers配置文件：vi /workers
编辑name node服务器内的，workers文件，将要启动的主机名添加到这里，以后hadoop-daemon.sh启动服务时会先读取这个配置文件中的主机，并将主机里的服务启动。
[root@master hadoop]# more ./workers
slave1
slave2

hide

Hadoop与Java配套

leaf

Jdk1.7->Hadoop2.0

leaf

Jdk1.8->Hadoop3.0

hide

关闭防火墙

hide

相关命令(仅供参考)

leaf

（1）设置开机启用防火墙：systemctl enable firewalld.service

leaf

（2）设置开机禁用防火墙：systemctl disable firewalld.service

leaf

（3）启动防火墙：systemctl start firewalld

leaf

（4）关闭防火墙：systemctl stop firewalld

leaf

（5）检查防火墙状态：systemctl status firewalld

hide

hide

实训1为Hadoop集群新增节点

hide

leaf

掌握Hadoop集群的

leaf

掌握JDK的安装方法

hide

leaf

掌握Hadoop集群的搭建

leaf

掌握Hadoop集群的启动与关闭

leaf

熟悉Hadoop集群的监控

hide

实训需求说明

leaf

在已有的集群中新增一个子节点

hide

实现思路及步骤

leaf

克隆虚拟机

leaf

参考其它从节点修改新增节点的配置

leaf

在主节点和所有子节点修改workder,添加新增节点名称

leaf

配置ssh免密登录到新增节点

leaf

重启集群，或单独启动新增节点

hide

具体操作参考

hide

新增全新节点

leaf

1,clone虚拟机centos7

leaf

2,设置IP地址： vi /etc/sysconfig/network-scripts/ifcfg-ens33

leaf

3,在虚拟机属性中设置网络类型为NAT

hide

4,更改hostname

leaf

1,修改显示主机名：hostnamectl set-hostname slave3

hide

2,修改网络主机名：

leaf

vi /etc/sysconfig/network

leaf

HOSTNAME=slave3

hide

leaf

编辑所有的节点
vi /etc/hosts
192.168.137.133 master master.centos.com
192.168.137.134 slave1 slave1.centos.com
192.168.137.135 slave2 slave2.centos.com
192.168.137.136 slave3 slave3.centos.com

hide

crt中批量添加

leaf

sed -i '1i\192.168.137.137 slave4 slave4.centos.com' /etc/hosts

leaf

表示向/etc/hosts文件里的第1行的前面添加内容

hide

6,从master复制公钥到slave3

leaf

ssh-copy-id -i /root/.ssh/id_rsa.pub slave3

hide

leaf

拷贝hadoop安装文件到集群slave节点:
scp -r /usr/local/hadoop-3.3.1/ slave3:/usr/local
拷贝环境变量配置文件:
scp /etc/profile slave3:/etc/profile

hide

8,配置时间同步ntp

leaf

yum -y install ntp

leaf

修改/etc/ntp.conf文件，注释掉server开头的行，并添加:server master

leaf

service iptables stop & chkconfig iptables off

leaf

leaf

service ntpd start & chkconfig ntpd on

hide

10,修改/etc/profile

leaf

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre

hide

11,关闭防火墙

leaf

systemctl disable firewalld

leaf

service stop firewalld

hide

12,启动子节点

leaf

　　hadoop-daemon.sh start datanode

leaf

　　yarn-daemon.sh start nodemanager

hide

实训作业要求

leaf

1，环境说明:本小组主机:,本小组成员机:,本成员机:,新增从机:

leaf

2，简要说明新增从机的步骤，并截取过程截图

leaf

3，截图：新增从机后hdfs:http://master:9870的node列表?

User Link

leaf

4，截图：新增从机后yarn:http://master:8088的node列表?

User Link

hide

实训3编写shell脚本实现配置文件的分发

hide

leaf

掌握集群中配置文件或包文件的批量分发

leaf

熟练使用scp命令

leaf

熟练使用shell脚本

hide

leaf

在master上的hadoop配置目录下创建./scp.sh

leaf

编辑scp.sh，添加scp命令，复制本目录下所有文件到从机

leaf

运行./scp.sh，观察配置文件是否成功复制到从机

hide

leaf

在master上: cd /usr/local/hadoop-3.3.1/etc/hadoop

leaf

测试scp命令,复制配置文件到10.255.10.123的/root/myname目录下

leaf

参考下方脚本
[root@master hadoop]# vi ./scp.sh
scp * c32:/usr/local/hadoop-3.3.1/etc/hadoop/
scp * c33:/usr/local/hadoop-3.3.1/etc/hadoop/
scp * c34:/usr/local/hadoop-3.3.1/etc/hadoop/

leaf

chmod 777 ./scp.sh

leaf

运行./scp.sh,观察运行情况

hide

leaf

1，环境说明:本小组主机:,本小组成员机:,本成员机:

leaf

2，拍照截取scp * 10.255.10.123:/root/myname/ 的运行结果

leaf

3，拍照截取./scp.sh的脚本，以及运行结果

hide

实训4优化配置文件分发脚本

leaf

chmod 777 /usr/local/hadoop-3.3.1/etc/hadoop/workers
vi /root/scp_workers.sh
chmod 777 /root/scp_workers.sh
[root@master ~]# more ./scp_workers.sh
#!/bin/bash
workers=`cat /usr/local/hadoop-3.3.1/etc/hadoop/workers`
port =22
for w in $workers
do
scp -P $port /usr/local/hadoop-3.3.1/etc/hadoop/* $w:/usr/local/hadoop-3.3.1/etc/hadoop/
scp -P $port /usr/local/hadoop-3.3.1/share/hadoop/common/* $w:/usr/local/hadoop-3.3.1/share/hadoop/common/
scp -P $port /etc/ntp.conf $w:/etc/
scp -P $port /root/restart_slave.sh $w:/root/
done
[root@master ~]#

leaf

[root@master ~]# more ./scp_workers.sh
#!/bin/bash
workers=`cat /usr/local/hadoop-3.3.1/etc/hadoop/workers`
port=22 #定义变量port，用于保存 ssh端口
Usage () { #定义函数Usage，输出脚本使用方法
echo "Usage:"
echo "scp_workers.sh [-p port][-h] "
exit -1
}
while getopts :p:h varname #告诉getopts此脚本有-p -h
do
case $varname in
h)
Usage
exit
;;
p)
port=$OPTARG
echo "$port"
continue
;;
esac
done

for w in $workers
do
scp -P $port /usr/local/hadoop-3.3.1/etc/hadoop/* $w:/usr/local/hadoop-3.3.1/etc/hadoop/
scp -P $port /usr/local/hadoop-3.3.1/share/hadoop/common/* $w:/usr/local/hadoop-3.3.1/share/hadoop/common/
scp -P $port /etc/ntp.conf $w:/etc/
scp -P $port /root/restart_slave.sh $w:/root/
done

hide

实训5实现从节点的服务重启

leaf

vi /root/restart_master.sh

leaf

vi /root/restart_master.sh
/usr/local/hadoop-3.3.1/sbin/stop-all.sh
/usr/local/hadoop-3.3.1/sbin/start-all.sh

chmod 777 /root/restart_master.sh

hide

hide

添加节点时在ssh-copy-id报异常

leaf

命令:ssh-copy-id -i /root/.ssh/id_rsa.pub slave3

leaf

现象:Host key verification failed.

leaf

处理:vi /root/.ssh/known_hosts ,将slave3这行删除

hide

添加节点后,节点未能加入成功

leaf

日志:ERROR org.apache.hadoop.hdfs.StateChange: BLOCK* NameSystem.getDatanode

leaf

日志:org.apache.hadoop.hdfs.protocol.UnregisteredNodeException

leaf

处理:删除新增节点的数据目录:rm -rf /data/hadoop/hdfs/data/current/*

hide

ERROR: Attempting to operate on hdfs namenode as root

leaf

Starting namenodes on [master]
ERROR: Attempting to operate on hdfs namenode as root
ERROR: but there is no HDFS_NAMENODE_USER defined. Aborting operation.
Starting datanodes
ERROR: Attempting to operate on hdfs datanode as root
ERROR: but there is no HDFS_DATANODE_USER defined. Aborting operation.
Starting secondary namenodes [master]
ERROR: Attempting to operate on hdfs secondarynamenode as root
ERROR: but there is no HDFS_SECONDARYNAMENODE_USER defined. Aborting operation.

leaf

在/hadoop/sbin路径下：
将start-dfs.sh，stop-dfs.sh两个文件顶部添加以下参数

#!/usr/bin/env bash
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

还有，start-yarn.sh，stop-yarn.sh顶部也需添加以下：

#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

hide

master: ERROR: JAVA_HOME is not set and could not be found.

leaf

vi /usr/local/hadoop-3.3.1/etc/hadoop/hadoop-env.sh

将语句 export JAVA_HOME=$JAVA_HOME
修改为 export JAVA_HOME=/usr/java/jdk1.8.0_101
-> /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.312.b07-1.el7_9.x86_64/jre

hide

ERROR: but there is no YARN_RESOURCEMANAGER_USER defined. Aborting operation.

leaf

还有，start-yarn.sh，stop-yarn.sh顶部也需添加以下：

#!/usr/bin/env bash
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

hide

master机NameNode没有启动

leaf

先手动启动namenode后，再启动dfs

leaf

./hadoop-daemon.sh start namenode
./hadoop-daemon.sh start secondarynamenode
./mr-jobhistory-daemon.sh start historyserver

leaf

hide

slave机NodeManager没有启动

leaf

配置文件core-site.xml和hdfs-site.xml中端口

hide

hdfs监控：http://192.168.137.133:9870/

hide

messagebox_warning

Configured Capacity:0 B

leaf

删除 /etc/hosts 文件中127.0.0.1行

leaf

正确的
[root@master sbin]# more /etc/hosts
192.168.137.133 master master.centos.com
192.168.137.134 slave1 slave1.centos.com
192.168.137.135 slave2 slave2.centos.com
[root@master sbin]#

hide

messagebox_warning

http://slave1:9864无法打开

leaf

在windows文件中找到System32-->drivers-->etc,进入到etc文件夹中就能看到hosts

leaf

192.168.137.134 slave1
192.168.137.135 slave2
192.168.137.133 master

hide

yarn监控：http://192.168.137.133:8088/

hide

http://slave1:8042无法打开

leaf

在windows文件中找到System32-->drivers-->etc,进入到etc文件夹中就能看到hosts

leaf

若权限问题,打开属性,添加用户

leaf

192.168.137.134 slave1
192.168.137.135 slave2
192.168.137.133 master

hide

启动报jdk错误

leaf

ERROR: JAVA_HOME /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.312.b07-1.el7_9.x86_64/jre does not exist.

hide

java -verbose查看

leaf

/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.322.b06-1.el7_9.x86_64/jre/lib/rt.jar

hide

报jps命令不存在

hide

leaf

[root@c78 ~]# jps

User Link

leaf

-bash: jps: command not found

hide

hide

leaf

yum remove -y java-1.8.0-openjdk-devel.x86_64

hide

leaf

yum install -y java-1.8.0-openjdk-devel.x86_64

hide

wmware启动时提示内部错误

leaf

尝试一:计算机管理->服务->检查WMware5个服务是否都开启

hide

datanode移动到另一集群问题

hide

切换集群后,datanode日志报错

leaf

java.io.IOException: Incompatible clusterIDs in /data/hadoop/hdfs/data: namenode clusterID = CID-4e682a36-d31c-41ce-a749-0c88f3aa3f31; datanode clusterID = CID-1e032d4f-4664-41d3-bef2-044e2bcececa

leaf

ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool <registering> (Datanode Uuid 2816cfa5-11cf-485d-aced-f2abb9de1ae3) service to master/192.168.31.52:9864. Exiting.
java.io.IOException: All specified directories have failed to load.

hide

leaf

http://i.hddly.cn/media/SecureCRT_81gsBF3af4.png

User Link

hide

新增节点在web监控界面没有增加datanode

leaf

尝试清空浏览器数据，刷新页面

hide

新增节点在yarn监控界面没有增加节点

hide

分析没有增加进来的节点的日志异常

leaf

yarn.client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at master/192.168.31.52:8031

hide

处理:增加8031端口的转发

leaf

由于master主机在NAT内网，因此在外网的机器要访问内网的master,需要在vmware虚拟网络中nat中进行端口转发

hide

测试:在linux上测试example的Pi,

leaf

可以创建任务,yarn web上也能看到

hide

nptd服务异常

leaf

no server suitable for synchronization found

hide

尝试关闭防火墙

leaf

systemctl disable firewalld

leaf

systemctl stop firewalld

leaf

尝试:ntpdate time.nist.gov

leaf

客户端尝试: ntpdate master

leaf

使用cp,替换当前时区为上海时区，如有提示，输入yes进行确认
cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

hide

Liux时区设置

leaf

使用cp,替换当前时区为上海时区，如有提示，输入yes进行确认
cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

hide

HDFS重新格式化

leaf

1,删除所有从机的/data/hadoop目录:
rm -rf /data/hadoop

leaf

2,删除hadoop目录下的/tmp目录
rm -rf /usr/local/hadoop-3.3.1/tmp/*

leaf

3,停止集群
stop-all.sh

leaf

4,格式化hdfs
hdfs namenode -format

leaf

3,启动集群
start-all.sh

hide

降低hdfs上权限

hide

给根目录加权限

leaf

hdfs dfs -chmod -R 777 /

hide

退出安全模式

hide

查看hdfs safe mode

leaf

hadoop dfsadmin -safemode get

hide

退出hdfs safe mode

leaf

hadoop dfsadmin -safemode leave

hide

hide

Ver1.1-20220121

leaf

hide

Ver1.2-20230301

leaf

修改Hadoop部分操作步骤，增加常见问题(来自大数据综合实训的hadoop集群)