![基于Hadoop与Spark的大数据开发实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/568/24981568/b_24981568.jpg)
任务3 安装Hadoop平台
关键步骤如下。
虚拟机安装。
CentOS安装。
Hadoop伪分布式环境搭建。
1.3.1 安装虚拟机
1.虚拟机概述
虚拟机软件使你可以在一台机器上同时运行两个或更多个Windows、Linux系统。它可以模拟一个标准的PC环境,这个环境和真实的计算机一样,也有芯片组、CPU、内存、显卡、声卡、网卡、软驱、硬盘、光驱、串口、并口、USB控制器等。
常用的虚拟机软件:
(1)VMware Workstation(本书采用该软件,版本可以任意选择,区别不大)。
(2)Virtual Box。
2.VMware安装
(1)点击安装文件后启动界面,欢迎界面如图1.2所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0027-0005.jpg?sign=1739285504-1nD80RbBbxaHPjRr9xiiHoA1eqWUlTeN-0-87d9530509c5aaa16d45e3fba49eaf83)
图1.2 安装VMware——欢迎界面
(2)点击“下一步”按钮,界面如图1.3所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0027-0006.jpg?sign=1739285504-F6ERRylytvl10vktKwHCqXxAtCM2mZB9-0-80cf84c76d08a9cb646cb443eb3c5835)
图1.3 安装VMware——接受安装许可
(3)选择“我接受许可协议中的条款”后点击“下一步”按钮,点击“自定义”按钮,如图1.4所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0028-0007.jpg?sign=1739285504-Y5JXwaY4Hf0rXWkhYr24xDf4yBFvtgRw-0-5f5c3052b836a5414356e27b7966cdf8)
图1.4 安装VMware——自定义安装
(4)更改安装位置和选择安装功能后如图1.5所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0028-0008.jpg?sign=1739285504-fEprQZ2gX2ISgY3Eh59pNfmoE4EyzKva-0-a4e621bf6dfdd4a54e158359226201cb)
图1.5 安装VMware——选择安装目录
(5)点击“下一步”按钮后如图1.6所示。
(6)勾选“桌面”和“开始菜单程序文件夹”复选框后点击“下一步”按钮,如图1.7所示。
(7)点击“继续”按钮,界面如图1.8所示。
(8)“安装向导完成”界面如图1.9所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0029-0009.jpg?sign=1739285504-oW2HsdDEKyvjJ07JhSrE4kDCQfCUwxaK-0-75b1dcd5c853fb4811ce310cb75dde39)
图1.6 安装VMware——安装组件
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0029-0010.jpg?sign=1739285504-SVl2XVT0mp05UyELdP4fo03R4kfBC7Bj-0-950281576898b64160c84706d24e816a)
图1.7 安装VMware——选择创建快捷方式
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0029-0011.jpg?sign=1739285504-YHnYAfqYDyRMcspSkRcPSebDey6Yc3wd-0-6d40020fbcb6f8d689ff0d233195278a)
图1.8 安装VMware——继续安装
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0030-0012.jpg?sign=1739285504-UFRIqmSPuqcDAIl70cVjRqkeo3SRBwZP-0-2e366b730b8319f6382309e94880550c)
图1.9 安装VMware——安装完成
1.3.2 安装Linux系统
1.Linux概述
Linux是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的免费使用和自由传播的类UNIX操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议,它支持32位和64位硬件。Linux继承了UNIX以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。
Linux操作系统诞生于1991年10月5日(这是其第一次正式对外公布的时间)。Linux可安装在手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机等各种设备中。
严格来讲,Linux这个词本身只表示Linux内核,但实际上人们已经习惯了用Linux来形容整个基于Linux内核并且使用GNU 工程各种工具和数据库的操作系统。
Linux是一种自由和开放源码的系统,并有GPL授权,全世界的任何人都可以对其源代码进行修改然后发布使用,所以存在着许多不同的Linux版本,但它们都使用了Linux内核。所以Linux存在很多的变种以及版本。
(1)Ubuntu:2004年9月发布,最为流行的桌面Linux发行版;个人应用比较多,社区力量很庞大。
(2)Red Hat:使用最广,性能稳定;商业版。
(3)CentOS:2003年底推出,RHEL的重新编译版,免费;服务器发行版;本书将采用该版本。
为什么选择CentOS?
(1)主流:目前的Linux操作系统主要应用于生产环境,主流企业级Linux系统仍旧是Red Hat或者CentOS。
(2)免费:Red Hat和CentOS差别不大。CentOS是一个基于Red Hat Linux提供的可自由使用源代码的企业级Linux发行版。
(3)更新方便:CentOS独有的yum命令支持在线升级,可以即时更新系统,不像Red Hat那样需要花钱购买支持服务。
2.CentOS安装
(1)首先安装VMware Workstation,安装过程参见VMware安装。
(2)点击【文件】/【新建虚拟机】或直接点击【创建新的虚拟机】图标,如图1.10所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0031-0013.jpg?sign=1739285504-NIKfcrcmCOvqQQbThwDaZwXNEBFPfg2V-0-d7c8d631758753eabc3871ef44373d1e)
图1.10 安装CentOS——新建虚拟机
(3)在图1.11中选择“典型(推荐)”,点击“下一步”按钮。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0031-0014.jpg?sign=1739285504-XEvSwrsoiUnpdZoO7uoHpTc50lunL09v-0-d3b979d0661138631074f758226e02a8)
图1.11 安装CentOS——选择典型方式安装
(4)在图1.12中选择“稍后安装操作系统”。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0032-0015.jpg?sign=1739285504-EQzvbeYe5pOoXIWpDLTik05UeMqC7vsY-0-e8dc20bf1db5ac0a1cb975b010775611)
图1.12 安装CentOS——选择稍后安装操作系统
(5)在图1.13中选择操作系统和版本。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0032-0016.jpg?sign=1739285504-A7ytCkx94mE8UhyAcJimpGsVmg3dsWYO-0-c0981969758b2e0ea5956c8946a81c6d)
图1.13 安装CentOS——选择Linux以及64位系统
(6)在图1.14中输入虚拟机名称和安装路径。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0033-0017.jpg?sign=1739285504-wrFQkxFu68cF4Kvixi6K4fpM8GDmbxXh-0-3a4c46dec8d1f773aadbdafbe3147406)
图1.14 安装CentOS——虚拟机名称和安装路径
(7)在图1.15中设置磁盘大小。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0033-0018.jpg?sign=1739285504-3F18ckyqWITnUzXsDwklncjrqu3BiRky-0-b984827bdf69fde666f4aaa59e9153cc)
图1.15 安装CentOS——选择磁盘占用空间
(8)在图1.16中自定义硬件。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0034-0019.jpg?sign=1739285504-HC2JTT1wVVd7ZO8LTuD54ngROzhhJP2g-0-30d4a0354aa0fc6a2498dc41d9722394)
图1.16 安装CentOS——自定义硬件
(9)在图1.17中选择CentOS安装镜像文件。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0034-0020.jpg?sign=1739285504-Z0ifIfTVPt1v8Uqy9Mm2JSwNAp08sUHO-0-4ff216ab961364fb33743f4204f5c709)
图1.17 安装CentOS——选择CentOS的镜像文件
(10)在图1.18中点击“完成”按钮。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0035-0021.jpg?sign=1739285504-eBR5dN0RD6VxS5EggZG9klCNLE3eBI18-0-08c17bf62135f6a7229d75b57c287ab9)
图1.18 安装CentOS——完成
(11)在图1.19中启动虚拟机。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0035-0022.jpg?sign=1739285504-MxoS6lCgc8Kp8Z8TmP2PkdNordaPQYOn-0-4bc0d2e621f02f38be8c567af13e598a)
图1.19 安装CentOS——启动
(12)在图1.20中选择第一项,安装全新操作系统或升级现有操作系统。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0036-0023.jpg?sign=1739285504-ZPBIh2YxYSYghfpxSwcgZHYzbe62YaxK-0-f76246291f0861f0da89ee180810ac2e)
图1.20 安装CentOS——选择安装或者更新系统
(13)在图1.21中按Tab键选择Skip,退出检测。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0036-0024.jpg?sign=1739285504-S1Fp5GTgX8O6lG3K3D2h0g9M9AMLAsUG-0-0b7b93e60e0f847e203cc46c4dc961a9)
图1.21 安装CentOS——选择Skip
(14)在图1.22中点击Next按钮。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0037-0025.jpg?sign=1739285504-qrlWb4fO4FsczXBdbxRpkiNxJuTNzrdn-0-1a77179c665880ccde4567cdb428235a)
图1.22 安装CentOS——下一步
(15)在图1.23中选择语言,这里选择的是中文(简体)。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0037-0026.jpg?sign=1739285504-XvYqX6g9VUiNnWaYpq5B7jF7KCcjznF5-0-c97497fc945b5542f29eb373847e59ca)
图1.23 安装CentOS——选择语言
(16)在图1.24中选择键盘样式。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0038-0027.jpg?sign=1739285504-Su1X2uNlzS6WpEkZGgsbOdlCxykAqbvc-0-56d00bc3a58b151308a13b13ac77a2f3)
图1.24 安装CentOS——选择键盘样式
(17)在图1.25中选择存储设备。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0038-0028.jpg?sign=1739285504-pndQcrwNvOgWkABe2fQop2zr67xOBRkC-0-97fcc5fdb769041e527f4b9e41ec059c)
图1.25 安装CentOS——选择存储设备
如果以前安装过虚拟机,会出现图1.26所示的警告,选择“是,忽略所有数据”。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0039-0029.jpg?sign=1739285504-ORW0XCbU9SQbbMcTBo8QkHjlGq2IVwZl-0-bd8f4526c12ef749980b8a36f1574016)
图1.26 安装CentOS——忽略所有数据继续下一步
(18)在图1.27中输入主机名。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0039-0030.jpg?sign=1739285504-WZrFmrU1niVcX4OVQIKnwQXWLzWSYTj9-0-27d22b8e87bbc661c91b7a91442ef6ad)
图1.27 安装CentOS——输入主机名
(19)在图1.28中配置网络。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0040-0031.jpg?sign=1739285504-uHD3nTcEC6jRAr347o7RRu9Z3kd9ZVFX-0-0888facb4ebd8ac5e16f110d10b9c016)
图1.28 安装CentOS——配置网络
(20)在图1.29中设置时区,勾选“系统时钟使用UTC时间”。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0040-0032.jpg?sign=1739285504-Gp81z1nC2BLrlj2SiJr48z7hYcDbSsrZ-0-a01ce06ec4a7050893b3f1f6921edea1)
图1.29 安装CentOS——选择时区
(21)在图1.30中输入根用户(root)的密码。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0041-0033.jpg?sign=1739285504-hcP3RUVAvfVnewp77dB6hmhHhrJPZ9RL-0-c500d9e9e5d718d9d8c66cef5ce5836e)
图1.30 安装CentOS——为root用户输入密码
如果密码过于简单会出现提示,点击“无论如何都使用”,如图1.31所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0041-0034.jpg?sign=1739285504-oFh1FcVFPQjRfxKLakeYSK16UXHD3itW-0-fe6fef94f58a23dc78d85851578771f6)
图1.31 安装CentOS——密码过于简单的提示
(22)在图1.32中根据此Linux的具体功能,选择其他软件。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0042-0035.jpg?sign=1739285504-dijIuYrBJqf4MbZA1UFWU3hPm4oBujRr-0-0fc280ca2695376ddb9d7a2a4cc83017)
图1.32 安装CentOS——是否安装其他软件
(23)在图1.32中选择“现在自定义”,自定义安装需要的软件,如桌面配置,如图1.33所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0042-0036.jpg?sign=1739285504-wRjVVpKvh6N7DnBt27ssNciJHSu5XVhC-0-78c07e73d5b52486d6113fa8da425906)
图1.33 安装CentOS——安装自定义组件
可以根据具体的情况来配置,如图1.34中选择安装Eclipse。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0043-0037.jpg?sign=1739285504-3UN58Kc0IAKYFdIkQaYAg05Yrqjmoaii-0-ca112d2313e23fb92d8def8e948dd39c)
图1.34 安装CentOS——安装Eclipse
还可以如图1.35所示安装Java平台、Perl支持等。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0043-0038.jpg?sign=1739285504-nT4fLOnVwYVKYgtHpyDoyxkLkxbrQgee-0-e576391b4aa342fc8938761261176719)
图1.35 安装CentOS——安装Java环境
在图1.36中选择语言支持。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0044-0039.jpg?sign=1739285504-n4frNTTt6f5y3kZOiCzZcTbsLJviTCQG-0-3d7971821a13f676dcf795365e2c9ea7)
图1.36 安装CentOS——选择语言支持
(24)在图1.37中点击“下一步”按钮,开始安装。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0044-0040.jpg?sign=1739285504-MrfoysK4X31KhNwBUrcTDIBYpueISnGD-0-d6f3ef55713140e5bddfaebd9eed4122)
图1.37 安装CentOS——正在安装
(25)安装完成后,在图1.38所示界面点击“重新引导”按钮。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0045-0041.jpg?sign=1739285504-FA9qankZgPqqvflwpFQOQEiInWyLPgI2-0-711826cb672854cfb3edeefcc7437ee2)
图1.38 安装CentOS——重新引导
(26)点击“前进”按钮,如图1.39所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0045-0042.jpg?sign=1739285504-2PbtyfuoGMulFpR174s6GRa7XU0wJ7GR-0-59d3013d8a72a583c0f9597d3a32bcbc)
图1.39 安装CentOS——欢迎
(27)在图1.40中点击“是,我同意该许可证协议”,再点击“前进”按钮。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0046-0043.jpg?sign=1739285504-NEySNLEZx3F2moiA8JPIIKksod7Dz3lU-0-a05cecdf7ccf44d9e1a1e345ff2a0e0a)
图1.40 安装CentOS——同意许可证协议
(28)创建用户,如图1.41所示。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0046-0044.jpg?sign=1739285504-r6WtfISmCE8e6HbiRcsQ5l9VZhqgWjaz-0-1b53ed4b1ca596c634aff61148d1aff8)
图1.41 安装CentOS——创建用户
(29)在图1.42中设置日期和时间,如果可以上网,勾选“在网络上同步日期和时间”。
![](https://epubservercos.yuewen.com/0CB0C9/13311745105141206/epubprivate/OEBPS/Images/figure-0047-0045.jpg?sign=1739285504-SK40ehdhJTHBw7WF6NML8sB4lnzQeRAa-0-1c8907f70439302abbbe03115585979f)
图1.42 安装CentOS——设置日期和时间
(30)最后点击“前进”按钮,完成安装!
1.3.3 安装Hadoop伪分布式环境
Hadoop集群安装
1.Hadoop安装包下载
本书采用的是CDH版本的hadoop-2.6.0-cdh5.7.0,相关的下载地址为:http://archive.cloudera.com/cdh5/cdh/5/;下载完存放在~/software/目录下,相关的软件安装在~/app目录下。
2.Hadoop安装包解压
将下载的Hadoop安装包解压到~/app目录下。
tar -zxvf ~/software/hadoop-2.6.0-cdh5.7.0.tar.gz -C /app
3.Hadoop伪分布式环境搭建
Hadoop启动后,Name Node是通过SSH(Secure Shell)来启动和停止各个Data Node上的进程,所以先在本机上实现SSH免密码登录。
ssh-keygen -t rsa
ssh-copy-id localhost
成功执行上述两条命令后即可免密码登录至本机:
ssh localhost
其中localhost可为主机名或IP地址。
在进行伪分布式环境部署之前,先来了解下伪分布式环境部署和分布式环境部署的区别:
(1)伪分布式:在一台机器上启动Hadoop需要的所有进程进行工作。
(2)分布式:在多台机器上都部署Hadoop,按照集群的规划在不同的机器上启动各自需要的Haodop进程进行相互协调工作。
环境搭建的步骤如下。
(1)将Hadoop安装目录添加到系统环境变量(~/.bash_profile)中。
vi ~/.bash_profile
export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
export HADOOP_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0
export PATH=.:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin:$PATH
执行“source ~/.bash_profile”命令使得环境变量生效。
(2)配置Hadoop环境的配置文件hadoop-env.sh。
//设置JDK的安装路径
export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
(3)配置Hadoop核心文件core-site.xml。
//配置Name Node的主机名和端口号
<property>
<name>fs.default FS</name>
<value>hdfs://hadoop000:8020</value>
</property>
(4)配置HDFS文件hdfs-site.xml。
//设置HDFS元数据文件存放路径
<property>
<name>dfs.namenode.name.dir</name>
<value>/home/hadoop/tmp/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hadoop/tmp/dfs/data</value>
</property>
//设置HDFS文件副本数
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
//设置其他用户执行操作时会提醒没有权限的问题
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
注意
各目录一定要是非/tmp下的目录,否则默认是在/tmp下。如果是在虚拟机环境操作的话,每次重启后都会删除/tmp中的文件;该文件在Hadoop启动的时候会自动创建。
(5)配置Map Reduce文件mapred-site.xml。
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
(6)配置YARN文件yarn-site.xml。
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
(7)从节点配置文件slaves。
hadoop000
4.格式化HDFS系统
hadoop namenode -format
注意
格式化HDFS操作只有第一次才使用,如果对已有的集群再一次执行格式化操作,那么已有集群上的数据会全部丢失。
5.启动HDFS
(1)常用的启动方式有两种。
启动方式一:一次启动所有进程
$HADOOP_HOME/sbin/start-dfs.sh
启动完成后可以通过jps命令检测是否启动成功,如果正常启动会有如下3个进程:
jps
Secondary Name Node
Name Node
Data Node
启动方式二:单独启动每个进程
//启动namenode
hadoop-daemon.sh start namenode
//jps检测会有Name Node进程
//启动datanode
hadoop-daemon.sh start datanode
//jps检测会有Data Node进程
//启动secondarynamenode
hadoop-daemon.sh start secondarynamenode
//jps检测会有Secondary Name Node进程
(2)使用命令操作HDFS文件系统。
详细的HDFS脚本命令会在第2章中详细讲解,本章只做一个简单的应用。
//创建HDFS目录
hadoop fs -mkdir /helloworld
//查看目录是否创建成功
hadoop fs -ls /
(3)HDFS界面浏览器访问:http://hadoop000:50070。
6.启动YARN
(1)常用的启动方式有两种。
启动方式一:一次启动所有进程
$HADOOP_HOME/sbin/start-yarn.sh
启动完成后可以通过jps命令检测是否启动成功,如果正常启动会有如下两个进程。
jps
Node Manager
Resource Manager
启动方式二:单独启动每个进程
//启动resourcemanager
yarn-daemon.sh start resourcemanager
//jps检测会有jps: Resource Manager进程
//启动resourcemanager
yarn-daemon.sh start nodemanager
//jps检测会有jps: Node Manager进程
(2)运行wordcount测试案例。
Hadoop安装包中自带了wordcount的应用程序,jar包所处路径为:$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar。
//wordcount要测试的数据文件:hello.txt,使用制表符进行分隔
hello world hello
hello welcome world
//将hello.txt文件上传到HDFS文件系统上去
Hadoop fs -put hello.txt /
//提交mapreduce作业到yarn上运行
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar wordcount /hello.txt /wc_out/
//查看wordcount统计结果
hadoop fs -text /wc_out/part*
hello 3
welcome 1
world 2
(3)YARN界面浏览器访问:http://hadoop000:8088。