Hadoop文件系统如何快速安装?

本节向大家介绍一下Hadoop文件系统的快速安装与使用,希望通过本节的介绍大家能够掌握Hadoop文件系统安装与使用方法,欢迎大家一起来学习。

公司主营业务:网站设计、网站制作、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联推出乌恰免费做网站回馈大家。

Hadoop文件系统(HDFS)快速安装与使用技术文档

准备3台机器,一台作为Namenode,命名为master,两台作为dataNode,命名为slave01,slave02
在3台机器上都设置hadoop用户。

设置hadoop用户从master到slavessh不需要密码,设置方法参见“设置SSH服务器只采用密钥认证”一文。
注意:
(1)authorized_keys文件的访问权限应该设置为644,否则可能导致无密码登录失败。
(2)从master到master登录也需要配置无密码登录,否则会导致Namenode启动失败
下载并安装JDK,并在/etc/profile配置相应的环境变量,比如
JAVA_HOME=/usr/java/jdk1.6.0_18
CLASSPATH=.:$JAVA_HOME/lib
PATH=$JAVA_HOME/bin:$PATH
exportJAVA_HOMECLASSPATHPATH
在三台机器上创建相同的目录路径,为HDFS运行准备环境,比如在/data目录下创建hadoop目录,将其属主改成hadoop,然后在下面如下创建4个目录:
install:Hadoop源码解压后,放在该目录下
name:HDFS的名字节点存放目录
data01,data02:HDFS的数据存放目录,当然也可以是一个。
tmp:临时空间
注意:name目录只存放在master上,且权限为755,否则会导致后面的格式化失败。

编辑Hadoop文件系统HDFS配置文件,所有节点都要保持一致,共有四个:
core-site.xml:核心配置
hdfs-site.xml:站点多项参数配置
masters:主节点,在HDFS中就是Namenode的名称
slaves:数据节点(Datanode)名称

各个配置文件举例
核心配置:core-site.xml


fs.default.name
hdfs://master:9000

站点节点配置:hdfs-site.xml

 
 
 
  1. dfs.replication
  2. 2
  3. dfs.name.dir
  4. /data/hadoop/name
  5. dfs.data.dir
  6. /data/hadoop/data01,/data/hadoop/data02
  7. dfs.tmp.dir
  8. /data/hadoop/tmp

 主节点名称:masters
master

数据节点名称:slaves
master
slave01
slave02
注意:(1)如需要,可以在hadoop-env.sh中配置JAVA_HOME变量,比如:
exportJAVA_HOME=/usr/java/jdk1.6.0_18

(2)保证Hadoop文件系统各个节点上配置文件的一致性。
初始化namenode节点
登录到namenode上,cd/data/hadoop/install/bin,然后格式化Image文件的存储空间:
./hadoopnamenode-format
如果出错,就查看/data/hadoop/install/logs下的日志文件。

启动HDFS服务
在/data/hadoop/install/bin下有很多命令,
*start-all.sh启动所有的Hadoop守护,包括namenode,datanode,jobtracker,tasktrack,secondarynamenode。
*stop-all.sh停止所有的Hadoop。
*start-mapred.sh启动Map/Reduce守护,包括Jobtracker和Tasktrack。
*stop-mapred.sh停止Map/Reduce守护
*start-dfs.sh启动HadoopDFS守护,Namenode和Datanode。
*stop-dfs.sh停止DFS守护

简单使用
创建目录:./hadoopdfs-mkdirtest
查看目录:./hadoopdfs-ls
drwxr-xr-x-hadoopsupergroup02010-03-0421:27/user/hadoop/test
拷贝文件:./hadoopdfs-put/etc/servicestest,即把本地的文件存放到HDFS中

WEB界面
HDFS启动后,可以通过WEB界面来查看,缺省端口为50070,比如:http://master:50070/
即可查看整个HDFS的状态以及使用统计。
对于Mapreduce的WEB界面,缺省端口是50030。本节关于Hadoop文件系统的安装与使用介绍到这里。

标题名称:Hadoop文件系统如何快速安装?
链接地址:http://www.hantingmc.com/qtweb/news37/45437.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联