Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
配置文件位于hadoop-3.1.2/etc/hadoop中,伪分布式需要修改2个配置文件core-site.xml和hdfs-site.xml。Hadoop的配置文件是xml格式,每个配置以声明property的name和value的方式来实现。
cd /path/to/HADOOP
tar -xvf hadoop-3.1.2.tar.gz
cd hadoop-3.1.2
mkdir hdfs mkdir hdfs/tmp mkdir hdfs/name mkdir hdfs/data
cd etc/hadoop/
vi core-site.xml
修改前:
<configuration> </configuration>
修改后:
<configuration> <property> <name>hadoop.tmp.dir</name> <value>file:/path/to/HADOOP/hadoop-3.1.2/hdfs/tmp</value> <description>Abase for other temporary directories.</description> </property> <property> <name>io.file.buffer.size</name> <value>4096</value> </property> <property> <name>fs.defaultFS</name> <value>hdfs://armnode2:9000</value> </property> <property> <name>fs.trash.interval</name> <value>1440</value> </property> </configuration>
“armnode2”为安装环境的主机名,用户根据实际情况进行配置,可以使用“hostname”查询安装环境的主机名。
vi hdfs-site.xml
修改前:
<configuration> </configuration>
修改后:
<configuration> <property> <name>dfs.namenode.http-address</name> <value>armnode2:50070</value> </property> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/path/to/HADOOP/hadoop-3.1.2/hdfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/path/to/HADOOP/hadoop-3.1.2/hdfs/data</value> </property> <property> <name>dfs.webmnt.enabled</name> <value>true</value> </property> <property> <name>dfs.permissions</name> <value>false</value> </property> </configuration>
“armnode2”为安装环境的主机名,用户根据实际情况进行配置,可以使用“hostname”查询安装环境的主机名。
vi workers
armnode2
cd /path/to/HADOOP/hadoop-3.1.2/etc/hadoop cp workers master cp workers slaves