Linux环境Docker容器安装与使用(六)——安装Hadoop大数据集群
cac55 2025-06-24 11:58 4 浏览 0 评论
简介:Hadoop是一种分析和处理大数据的软件平台,是Appach开源软件的一个架构,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计算。Hadoop框架最核心的设计就是HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
Hadoop使用主/从(Master/Slave)架构,主要有NameNode,DataNode,secondary NameNode,JobTracker,TaskTracker五种角色。其中NameNode,secondary NameNode,JobTracker三种角色运行在Master节点上,其余的两种角色DataNode和TaskTracker运行在Slave节点上。
在集群中每个从服务器都运行一个DataNode后台程序,后台程序负责把HDFS数据块读写到本地文件系统。需要读写数据时,由NameNode告诉客户端去哪个DataNode进行具体的读写操作。而NameNode是HDFS的守护程序,负责记录文件是如何分割成数据块的,以及这些数据块被存储到哪些数据节点上。它的功能是对内存及I/O进行集中管理。另外,Secondary NameNode是一个用来监控HDFS状态的辅助后台程序,如果NameNode发生问题,可以使用Secondary NameNode作为备用的NameNode。JobTracker后台程序用来连接应用程序与Hadoop,用户应用提交到集群后,由JobTracker决定哪个文件处理哪个task执行,一旦某个task失败,JobTracker会自动开启这个task。而位于从节点的TaskTracker负责存储数据的DataNode相结合,负责各自的Task。
本文将介绍在容器Docker中安装和部署Hadoop大数据集群的过程,详细内容请参考下文。
一、登陆Linux系统
二、查看Docker运行状态
执行指令# systemctl status docker查看Docker的运行状态。如下图
三、使用docker部署Hadoop
1、抽取Hadoop镜像
执行指令# docker pull
kiwenlau/hadoop-master:0.1.0。如下图
2、下载Hadoop代码
执行指令# git clone
https://github.com/kiwenlau/hadoop-cluster-docker下载代码。如下图
3、创建Hadoop网桥
执行指令# docker network create hadoop。如下图
4、启动Hadoop容器
执行指令# sh start-container.sh。如下图
备注:一共开启了3个容器,1个master, 2个slave。
5、开启Hadoop服务
(1)、查看master的root用户家目录的文件
备注:start-hadoop.sh是开启hadoop的shell脚本,而run-wordcount.sh是运行wordcount的shell脚本,可以测试镜像是否正常工作。
(2)、执行指令# sh start-hadoop.sh开启Hadoop服务。如下图
备注:这一步会ssh连接到每一个节点,确保ssh信任是正常的。
6、开启Wordcount服务
执行指令# sh run-wordcount.sh开启Wordcount服务。如下图
四、Hadoop常见配置文件
1、core-site.xml
执行指令# cd
/usr/local/hadoop/etc/hadoop。如下图
2、hdfs-site.xml
备注:这里是配置一个Master节点和两个Slave节点。所以dfs.replication配置为2。dfs.namenode.name.dir和dfs.datanode.data.dir分别配置为NameNode和DataNode的目录路径。
3、mapred-site.xml
备注:这里指定运行mapreduce的环境是yarn。
4、hadoop-env.sh
备注:这里必须要指定java的路径。否则启动Hadoop时,提示找不到变量JAVA_HOME。
五、Hadoop访问测试
1、访问Hadoop管理页面
在浏览器输入以下地址:
http://服务器IP地址:8088/cluster/nodes
访问界面如下:
2、访问HDFS管理页面
在浏览器输入以下地址:
http://服务器IP地址:50070/
访问界面如下:
3、访问HDFS内容页面
在浏览器输入以下地址:
http://服务器IP地址:50070/explorer.html#/
备注:由于默认开启了安全默认,默认是没有权限查看文件的。需要关闭安全模式才行。
4、关闭安全访问模式
(1)、进入hadoop-master容器,执行指令
# hadoop dfsadmin -safemode leave
(2)、授权tmp文件权限,执行指令
# hdfs dfs -chmod -R 755 /tmp
5、重新访问HDFS内容页面
访问tmp目录。如下图
访问user目录。如下图
备注:HDFS存放目录为:/root/hdfs。如果需要做持久化,将此目录开放出来。
相关推荐
- Linux服务器被黑客入侵后各排查项及排除步骤
-
Linux入侵排查0x00前言当企业发生黑客入侵、系统崩溃或其它影响业务正常运行的安全事件时,急需第一时间进行处理,使企业的网络信息系统在最短时间内恢复正常工作,进一步查找入侵来源,还原入侵事故...
- [常用工具] Python视频处理库VidGear使用指北
-
VidGear是一个高性能的Python视频处理库,它在预载多个专业视频图像处理库的基础上,如OpenCV、FFmpeg、ZeroMQ、picamera、starlette、yt_dlp、pyscre...
- 微信公众号自动回复及多客服功能实现
-
目录前期准备1、微信公众平台基本设置2、开发所需参数功能步骤1、填写服务器配置2、验证服务器地址的有效性3、依据接口文档实现业务逻辑具体实现1、微信接入2、自定义回复及多客服接入默认微信公众平台对公众...
- 电脑病毒怎么彻底清理?这3个方法可以解决!
-
案例:电脑中毒无法正常使用怎么办?怎么清理电脑病毒?如何彻底清除病毒?有没有小伙伴知道解决的方法?在使用电脑的过程中,我们经常会遇到电脑中病毒的情况,它们能够通过各种渠道感染你的计算机系统,给你带来许...
- 人在低谷落难的时候,一定要记住的4句话
-
凌晨三点在便利店啃面包时,我看见邻座大哥对着手机里的存款余额发呆,手指在屏幕上划了又划——原来成年人的崩溃,真的会藏在每个看似普通的深夜里。如果你也正在经历「人生断电期」,这10句从谷底爬起来的人总结...
- Linux环境Docker容器安装与使用(六)——安装Hadoop大数据集群
-
简介:Hadoop是一种分析和处理大数据的软件平台,是Appach开源软件的一个架构,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计算。Hadoop框架最核心的设计就是HDFS和MapR...
- (2023年最新)50个超实用电脑实用快捷键,提高操作效率10倍!
-
我们现在大多数工作都需要使用电脑,掌握简单的电脑知识,可以更好的提高操作效率,熟能生巧是没错,但还有一个方法就是使用快捷键。办公室文员必备技能知识;基本要求:打字快,会office办公软件(word文...
- 升级WIN10毛病多?解决这些问题,轻松应对!
-
1、win10网络不稳定①打开设置,进入网络和INTERNET。②在“WLAN页面”选择“管理Wi-Fi设置”。③在此页面上有个管理已知网络,里面记录着之前电脑连接过的无线网络连接,点击“连接名称”,...
- 史上最贱最贱的电脑病毒!(最致命的电脑病毒)
-
看了标题,有很多人是充满好奇心进来的,想看看有多贱!我可以郑重的告诉你,贱到你想掐死黑客!下面我给你介绍一下这个病毒是怎么个贱法!因为我亲身体验了一把!前几天我不知道怎么回事,我电脑莫名其妙多了几...
- 五千字长文全平台笔记软件obsidian同步攻略&图床使用教程
-
全平台笔记软件obsidianobsidian(黑曜石)是一个全平台的笔记软件,基础笔记功能免费,如果使用官方的同步功能好像是收费(我也不确定,因为我甚至没登陆过obsidian的账号)。可以使用ma...
- 工业自动化2.0演进:具有自我意识的运动控制
-
工业自动化领域的下一个发展方向要求机器能够独立调整其性能参数,以完成工厂操作人员分配的任务,或根据生产力增强的人工智能(AI)算法的输入,对机器自身重新配置以优化其行为。具有自我意识的机器的价值在于,...
- 零信任的时代到来!VPN将逐渐被取代
-
转自NETWORKWORLD,作者NealWeinberg,蓝色摩卡译,合作站点转载请注明原文译者和出处为超级盾!传统的VPN正在被一种更智能、更安全的网络安全方法所取代,这种方法将每个人都视为不受...
- 电脑键盘指法+常用快捷键文字及图片详解
-
图1:20190820(整理)(较全面的在后面)Ctrl+N:新建文档F4:重复上述操作Esc:取消当前操作HOME:光标跳转行首END:光标跳转到行尾WIN+L:锁定桌面WIN+E:开启磁...
- VPN正在消亡,零信任万岁
-
转自NETWORKWORLD,作者NealWeinberg,蓝色摩卡译,合作站点转载请注明原文译者和出处为超级盾!传统的VPN正在被一种更智能、更安全的网络安全方法所取代,这种方法将每个人都视为不受...
- Windows自带的「黑科技」工具,能让你少装10个软件!
-
电脑装了一堆软件,桌面却还是乱糟糟?其实Windows系统里藏着一堆“神器”,无需第三方工具就能搞定截图、录屏、OCR文字提取、系统加速……这7个冷门但逆天的内置工具,专治“软件成瘾症”,看完立马卸载...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- 如何绘制折线图 (52)
- javaabstract (48)
- 新浪微博头像 (53)
- grub4dos (66)
- s扫描器 (51)
- httpfile dll (48)
- ps实例教程 (55)
- taskmgr (51)
- s spline (61)
- vnc远程控制 (47)
- 数据丢失 (47)
- wbem (57)
- flac文件 (72)
- 网页制作基础教程 (53)
- 镜像文件刻录 (61)
- ug5 0软件免费下载 (78)
- debian下载 (53)
- ubuntu10 04 (60)
- web qq登录 (59)
- 笔记本变成无线路由 (52)
- flash player 11 4 (50)
- 右键菜单清理 (78)
- cuteftp 注册码 (57)
- ospf协议 (53)
- ms17 010 下载 (60)