位置: 编程技术 - 正文

Hadoop单机版和全分布式(集群)安装(hadoop有几个版本)

编辑:rootadmin

Hadoop,分布式的大数据存储和计算, 免费开源!有Linux基础的同学安装起来比较顺风顺水,写几个配置文件就可以启动了,本人菜鸟,所以写的比较详细。为了方便,本人使用三台的虚拟机系统是Ubuntu-。设置虚拟机的网络连接使用桥接方式,这样在一个局域网方便调试。单机和集群安装相差不多,先说单机然后补充集群的几点配置。

第一步,先安装工具软件编辑器:vimssh服务器: openssh,先安装ssh是为了使用远程终端工具(putty或xshell等),这样管理虚拟机就方便多了。

第二步,一些基本设置最好给虚拟机设置固定IP修改机器名,我这里指定的名字是:hadoopmaster ,以后用它做namenode修改hosts,方便应对IP变更,也方便记忆和识别

第三步,添加一个专门为hadoop使用的用户设置hadoop用户的sudo权限在 root ALL=(ALL:ALL)下面加一行 hadoop ALL=(ALL:ALL)切换到hadoop用户 su hadoop

第四步,解压安装JDK,HADOOP,PIG(顺便把PIG也安装了)修改解压后的目录名并且最终路径为:设置目录所属用户设置环境变量, 编辑~/.bashrc 或 ~/.profile 文件加入

第五步,.ssh无密码登录本机,也就是说ssh到本机不需要密码如果不起作用请修改权限:authorized_keys相当于白名单,id_rsa.pub是公钥,凡是在authorized_keys有请求者机器的公钥时ssh服务器直接放行,无需密码!

第六步,Hadoop必要设置所有设置文件在hadoop/conf目录下1、hadoop-env.sh 找到 #export JAVA_HOME 去掉注释#,并设置实际jdk路径2、core-site.xml3、mapred-site.xml4、hdfs-site.xml5、文件masters 和 文件slaves, 单机写 localhost 即可

第七步,启动Hadoop格式化Hadoop的HDFS文件系统执行Hadoop启动脚本,如果是集群的话在master上执行,其他slave节点Hadoop会通过ssh执行:执行命令 jps 如果显示有: Namenode,SecondaryNameNode,TaskTracker,DataNode,JobTracker等五个进程表示启动成功了!

第八步,集群的配置所有其他单机的安装跟上面相同,下面只增加集群的额外配置!最好先配置好一台单机,其他的可以通过scp直接复制,路径也最好相同包括java!本例的主机列表(设置hosts):

设置ssh,让master能够不要密码登录到其他slaves上,主要用来启动slavesmasters文件,添加作为secondarynamenode或namenode的主机名,一行一个。集群写master名如:hadoopmasterslaves文件,添加作为slave的主机名,一行一个。集群写子结点名:如 hadoopnode1、hadoopnode2

Hadoop管理hadoop启动后会启动一个任务管理服务和一个文件系统管理服务,是两个基于JETTY的WEB服务,所以可在线通过WEB的方式查看运行情况。任务管理服务运行在端口,如 当这个值是一个逗号分割的目录列表时,nametable数据将会被复制到所有目录中做冗余备份。2、dfs.data.dir:是DataNode存放块数据的本地文件系统路径,逗号分割的列表。 当这个值是逗号分割的目录列表时,数据将被存储在所有目录下,通常分布在不同设备上。3、dfs.replication:是数据需要备份的数量,默认是3,如果此数大于集群的机器数会出错。

推荐整理分享Hadoop单机版和全分布式(集群)安装(hadoop有几个版本),希望有所帮助,仅作参考,欢迎阅读内容。

Hadoop单机版和全分布式(集群)安装(hadoop有几个版本)

文章相关热门搜索词:hadoop单机模式的注意点,hadoop主流版本,安装单机hadoop,hadoop有几个版本,安装单机hadoop,hadoop有几个版本,单机hadoop安装过程,hadoop有几个版本,内容如对您有帮助,希望把文章链接给更多的朋友!

linux bash中too many arguments问题的解决方法 判断一个文件的内容是不是为空,使用语句:iftest-z`catfilename`当filename为空或者只有一行没有空格的字符串的时候,一切正常,反之,则会报:toomanyargum

linux bash shell中case语句的实例 bashcase语句的例子。分享一段bashshell代码,对于学习bash的同学理解case语句的用法,会有帮助。例子:#!/bin/bash###Program:#Fileoperation#1.)Openfile2.)Displayfile3.)Ed

shell中case的用法学习笔记 shell中的case语句:可以把变量的内容与多个模板进行匹配,再根据成功匹配的模板去决定应该执行哪部分代码。使用格式:case匹配母板in模板1[|模板2]…)

标签: hadoop有几个版本

本文链接地址:https://www.jiuchutong.com/biancheng/376761.html 转载请保留说明!

上一篇:Linux shell脚本全面学习入门(linux shell脚本命令)

下一篇:linux bash中too many arguments问题的解决方法

  • 城建税和教育费附加
  • 我国当前税制结构的基本情况是怎样的
  • 中国注册税务师协会法律法规库
  • 可明确区分的商品
  • 异地预缴的企业所得税可以抵扣吗
  • 法人购买商业保险能由公司承担吗
  • 直接抵免和间接抵免的区别
  • 申报个税人员金额一般
  • 小微企业十万免税从什么时候开始
  • 佣金的发票
  • 税控服务费列入管理费用什么费用?
  • 出国考察需要什么手续
  • 企业所得税汇算清缴退税怎么做账
  • 高温费计税吗
  • 库存商品毁损会导致什么
  • 发票作废进项税额转出怎么做账
  • 公司名下没有车可以开运输发票吗
  • 应收票据背书支付
  • 成品油一般经营企业交什么税
  • 不同项目的进项税可以抵销项税吗
  • 营改增后物业管理公司需要交营业税吗
  • 企业所得税季度申报时间
  • 生产成本中材料款年末要全部结转吗
  • 银行承兑电子汇票到期要怎么操作
  • 如何安装os x
  • 财务会计制度备案操作流程
  • 模具费属于什么费用
  • 减免增值税的优惠政策
  • 确认收入入账
  • phpexplode函数
  • 螃蟹不能和什么食物一起
  • 笔记本投屏到电视
  • go dll
  • 未开票收入以后必须开票吗
  • 奥克拉库克湾
  • php的exec
  • php array add
  • 营改增前建筑工程需交哪些税种
  • js怎么实现倒计时
  • es6箭头函数写法
  • php从服务器下载文件
  • 未确认融资费用报表填在哪个科目
  • 未开票金额怎么填写
  • 外贸出口企业的税务风险
  • 建筑业为什么要报统计局
  • 企业合并属于非企业吗
  • 出售其他债权投资产生的收益为什么计入留存收益
  • 卸车费属于什么费用
  • 无票收入不走对公账户
  • 无形资产未确认融资费用例题
  • 调整以前年度费用如何做分录
  • 优惠的会计分录
  • 加计抵减附加税怎么算
  • 管理费用怎么结转到本年利润未分配利润里了
  • 装修材料增值税发票明细表
  • 材料运费计入什么科目
  • 会计总账怎么登账
  • 明细账建账的步骤
  • sql server中删除触发器用
  • linux操作系统基本操作
  • Vista下jusched.exe进程与禁用
  • ubuntu系统如何切换中文
  • Linux系统中修改文件权限
  • xp任务栏靠右怎么调回来
  • sdstat.exe - sdstat是什么进程 有什么用
  • centos soft lockup
  • Linux history命令的几个使用小技巧
  • win10mobile更新出错
  • Extjs TimeField 显示正常时间格式的代码
  • 用android做一个简单的软件
  • 我是如何从0开始做到年入1000+万的
  • 淘宝国际平台叫什么
  • jquery使用教程
  • python编码函数
  • unity3d开发流程
  • 针对后台列表table拖拽比较实用的jquery拖动排序
  • jquery.inarray
  • jquery滚动条滚动事件
  • 如何电子税务局缴纳社保费用
  • 护士的专业素质要求
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设