linux怎么安装hadoop

发布时间 - 2021-12-17 00:00:00    点击率:
linux安装hadoop的方法:1、安装ssh服务;2、使用ssh进行无密码验证登录;3、下载Hadoop安装包;4、解压缩Hadoop安装包;5、配置Hadoop中相应的文件即可。

本文操作环境:ubuntu 16.04系统、Hadoop2.7.1版、Dell G3电脑。

linux怎么安装hadoop?

【大数据】Linux下安装Hadoop(2.7.1)详解及WordCount运行

一、引言

  在完成了Storm的环境配置之后,想着鼓捣一下Hadoop的安装,网上面的教程好多,但是没有一个特别切合的,所以在安装的过程中还是遇到了很多的麻烦,并且最后不断的查阅资料,终于解决了问题,感觉还是很好的,下面废话不多说,开始进入正题。

  本机器的配置环境如下:

    Hadoop(2.7.1)

    Ubuntu Linux(64位系统)

  下面分为几个步骤来详解配置过程。

二、安装ssh服务

  进入shell命令,输入如下命令,查看是否已经安装好ssh服务,若没有,则使用如下命令进行安装:

    sudo apt-get install ssh openssh-server

  安装过程还是比较轻松加愉快的。

三、使用ssh进行无密码验证登录

  1.创建ssh-key,这里我们采用rsa方式,使用如下命令:

    ssh-keygen -t rsa -P ""

  2.出现一个图形,出现的图形就是密码,不用管它

    cat ~/.ssh/id_rsa.pub >> authorized_keys(好像是可以省略的)

  3.然后即可无密码验证登录了,如下:

    ssh localhost

  成功截图如下:

    

四、下载Hadoop安装包

  下载Hadoop安装也有两种方式

    1.直接上官网进行下载,http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

    2.使用shell进行下载,命令如下:

      wget http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

  貌似第二种的方法要快点,经过漫长的等待,终于下载完成。

五、解压缩Hadoop安装包

  使用如下命令解压缩Hadoop安装包

    tar -zxvf hadoop-2.7.1.tar.gz

  解压缩完成后出现hadoop2.7.1的文件夹

六、配置Hadoop中相应的文件

  需要配置的文件如下,hadoop-env.sh,core-site.xml,mapred-site.xml.template,hdfs-site.xml,所有的文件均位于hadoop2.7.1/etc/hadoop下面,具体需要的配置如下:

  1.core-site.xml 配置如下:    


      
        hadoop.tmp.dir
        file:/home/leesf/program/hadoop/tmp
        Abase for other temporary directories.
      
      
        fs.defaultFS
        hdfs://localhost:9000
      
    

  其中的hadoop.tmp.dir的路径可以根据自己的习惯进行设置。

  2.mapred-site.xml.template配置如下:    

    
      
        mapred.job.tracker
        localhost:9001
      
    

  3.hdfs-site.xml配置如下:

    
      
        dfs.replication
        1
      
      
        dfs.namenode.name.dir
        file:/home/leesf/program/hadoop/tmp/dfs/name
      
      
        dfs.datanode.data.dir
        file:/home/leesf/program/hadoop/tmp/dfs/data
      
    

  其中dfs.namenode.name.dir和dfs.datanode.data.dir的路径可以自由设置,最好在hadoop.tmp.dir的目录下面。

  补充,如果运行Hadoop的时候发现找不到jdk,可以直接将jdk的路径放置在hadoop.env.sh里面,具体如下:

    export JAVA_HOME="/home/leesf/program/java/jdk1.8.0_60"

七、运行Hadoop

  在配置完成后,运行hadoop。

  1.初始化HDFS系统

    在hadop2.7.1目录下使用如下命令:

   bin/hdfs namenode -format

    截图如下:

     

    过程需要进行ssh验证,之前已经登录了,所以初始化过程之间键入y即可。

    成功的截图如下:

    

    表示已经初始化完成。

  2.开启NameNodeDataNode守护进程

    使用如下命令开启:

    sbin/start-dfs.sh,成功的截图如下:

    

  3.查看进程信息

    使用如下命令查看进程信息

    jps,截图如下:

    

    表示数据DataNode和NameNode都已经开启

  4.查看Web UI

    在浏览器中输入http://localhost:50070,即可查看相关信息,截图如下:

  至此,hadoop的环境就已经搭建好了。下面开始使用hadoop来运行一个WordCount例子。

八、运行WordCount Demo

  1.在本地新建一个文件,笔者在home/leesf目录下新建了一个words文档,里面的内容可以随便填写。

  2.在HDFS中新建一个文件夹,用于上传本地的words文档,在hadoop2.7.1目录下输入如下命令:

    bin/hdfs dfs -mkdir /test,表示在hdfs的根目录下建立了一个test目录

    使用如下命令可以查看HDFS根目录下的目录结构

    bin/hdfs dfs -ls /

    具体截图如下:

    

    表示在HDFS的根目录下已经建立了一个test目录

  3.将本地words文档上传到test目录中

    使用如下命令进行上传操作:

    bin/hdfs dfs -put /home/leesf/words /test/

    使用如下命令进行查看

    bin/hdfs dfs -ls /test/

    结果截图如下:

    

    表示已经将本地的words文档上传到了test目录下了。

  4.运行wordcount

    使用如下命令运行wordcount:

    bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /test/words /test/out

    截图如下:

    

    运行完成后,在/test目录下生成名为out的文件,使用如下命令查看/test目录下的文件

    bin/hdfs dfs -ls /test

    截图如下:

    

    表示在test目录下已经有了一个名为Out的文件目录

    输入如下命令查看out目录下的文件:

    bin/hdfs dfs -ls /test/out,结果截图如下:

    

    表示已经成功运行了,结果保存在part-r-00000中。

  5.查看运行结果

    使用如下命令查看运行结果:

    bin/hadoop fs -cat /test/out/part-r-00000

    结果截图如下:

    

  至此,运行过程就已经完成了。

九、总结

  在此次的hadoop配置过程遇到了很多问题,hadoop1.x和2.x的命令还是差别很大的,配置过程中还是一一的解决了问题,配置成功了,收获也很多,特此把这次配置的经验分享出来,也方便想要配置hadoop环境的各位园友,在配置的过程中有任何问题都欢迎讨论,谢谢各位园友的观看~

 推荐学习:《linux视频教程》


# linux  # Java  # xml  # hadoop  # storm  # hdfs  # mapreduce  # apache  # http  # ubuntu  # ui  # ssh  # 目录下  # 安装包  # 解压缩  # 文档  # 过程中  # 上传  # 完成后  # 进行下载  # 新建一个  # 自己的 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: Laravel如何升级到最新版本?(升级指南和步骤)  html文件怎么打开证书错误_https协议的html打开提示不安全【指南】  Laravel如何实现用户密码重置功能?(完整流程代码)  Swift中switch语句区间和元组模式匹配  香港服务器租用每月最低只需15元?  深圳网站制作设计招聘,关于服装设计的流行趋势,哪里的资料比较全面?  MySQL查询结果复制到新表的方法(更新、插入)  专业商城网站制作公司有哪些,pi商城官网是哪个?  如何在云指建站中生成FTP站点?  谷歌浏览器如何更改浏览器主题 Google Chrome主题设置教程  如何用AI帮你把自己的生活经历写成一个有趣的故事?  做企业网站制作流程,企业网站制作基本流程有哪些?  Laravel如何优化应用性能?(缓存和优化命令)  Laravel如何使用Contracts(契约)进行编程_Laravel契约接口与依赖反转  如何在阿里云虚拟主机上快速搭建个人网站?  使用豆包 AI 辅助进行简单网页 HTML 结构设计  深圳网站制作的公司有哪些,dido官方网站?  简历没回改:利用AI润色让你的文字更专业  佛山企业网站制作公司有哪些,沟通100网上服务官网?  如何用AI一键生成爆款短视频文案?小红书AI文案写作指令【教程】  猎豹浏览器开发者工具怎么打开 猎豹浏览器F12调试工具使用【前端必备】  怎么用AI帮你为初创公司进行市场定位分析?  如何在阿里云香港服务器快速搭建网站?  微信小程序 闭包写法详细介绍  Windows10如何更改计算机工作组_Win10系统属性修改Workgroup  logo在线制作免费网站在线制作好吗,DW网页制作时,如何在网页标题前加上logo?  Python文本处理实践_日志清洗解析【指导】  Laravel如何设置自定义的日志文件名_Laravel根据日期或用户ID生成动态日志【技巧】  昵图网官方站入口 昵图网素材图库官网入口  Swift中swift中的switch 语句  企业网站制作这些问题要关注  laravel怎么配置和使用PHP-FPM来优化性能_laravel PHP-FPM配置与性能优化方法  如何用西部建站助手快速创建专业网站?  php做exe能调用系统命令吗_执行cmd指令实现方式【详解】  微信小程序 wx.uploadFile无法上传解决办法  如何在云主机上快速搭建多站点网站?  如何在自有机房高效搭建专业网站?  如何在橙子建站上传落地页?操作指南详解  Laravel安装步骤详细教程_Laravel环境搭建指南  详解Android中Activity的四大启动模式实验简述  ai格式如何转html_将AI设计稿转换为HTML页面流程【页面】  微信小程序 input输入框控件详解及实例(多种示例)  如何快速辨别茅台真假?关键步骤解析  Laravel怎么集成Vue.js_Laravel Mix配置Vue开发环境  如何有效防御Web建站篡改攻击?  Laravel如何从数据库删除数据_Laravel destroy和delete方法区别  Laravel Fortify是什么,和Jetstream有什么关系  HTML 中如何正确使用模板变量为元素的 name 属性赋值  js实现获取鼠标当前的位置  Linux系统命令中tree命令详解