目前有一个台式机:win7系统+ubuntu虚拟机;一台Mac笔记本:win10系统+OS系统
考虑到机器的内存不是不够,安装多个虚拟机会有点卡,所以选择的是在一台机器上模拟Hadoop分布式。现在开始配置:
为了使你的虚拟机环境更具有标识性,可将主机名改为hadoop,说明这是一个hadoop的分布式开发环境
注意不同系统的修改主机名方式不一样,像CentOS就是在“/etc/sysconfig/network”文件里面,而Ubuntu就是直接修改“/etc/hostname”文件,或者直接使用图形化界面
修改完之后,命令行就是变成
也可以使用 hostname 命令来查看
- 检查是否已经安装了ssh:rpm -qa | grep ssh
- 如果显示没有安装,则执行yum install ssh 或者sudo apt-get install yum
- 开启ssh服务:service sshd start
-
在官网下载安装包:
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
-
在“/home/cherry"下新建一个目录java,将下载好的.tar.gz文件放在该路径下,然后在该路径下解压
-
配置环境变量,编辑gedit ~/.bashrc文件,在最后加上如下几行,需要注意的是,不能有多余的空格!
- 然后执行 source ~/.bashrc,使环境变量配置生效
- 测试java环境是否成功
需要注意的是,一定要保证虚拟机系统的位数和java位数一致,不然会报cannot execute binary file的错误
-
在官网下载安装包:
http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.4/hadoop-2.7.4.tar.gz
-
在“/home/cherry"下新建一个目录hadoop,将下载好的.tar.gz文件放在该路径下,然后在该路径下解压
-
配置环境变量,编辑gedit ~/.bashrc文件,在最后加上如下几行,同样不能有多余的空格!
需要补充的是:最好把sbin目录也加进去,因为到最后启动集群的时候发现,start-dfs.sh命令是在sbin目录下的,所以将PATH目录改为:export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
-
然后执行 source ~/.bashrc,使环境变量配置生效
-
/home/cherry/hadoop/hadoop-2.7.4/etc/hadoop/hadoop-env.sh
-
/home/cherry/hadoop/hadoop-2.7.4/etc/hadoop/core-site.xml
注意:如果不修改默认的临时文件地址,还是放在/tmp目录下的话,每次开机所有的临时文件都会被清除,hadoop namenode的一些配置也会被清除,导致每次开启服务时,都需要在重新执行hadoop namenode -format命令
-
/home/cherry/hadoop/hadoop-2.7.4/etc/hadoop/hdfs-site.xml
-
/home/cherry/hadoop/hadoop-2.7.4/etc/hadoop/mapred-site.xml
-
/home/cherry/hadoop/hadoop-2.7.4/etc/hadoop/yarn-site.xml