阅读量:0
HBase与Hadoop在Debian上的集成步骤
1. 安装前准备
- 更新系统:运行
sudo apt-get update && sudo apt-get upgrade,确保系统软件包为最新版本。 - 安装Java环境:HBase和Hadoop均依赖Java,推荐使用OpenJDK 8或11。例如安装OpenJDK 11:
sudo apt install openjdk-11-jdk,验证安装:java -version(需显示Java版本信息)。 - 下载软件包:从官方网站下载Hadoop(如3.3.4)和HBase(如2.4.9)的Debian兼容版本(
.tar.gz格式):- Hadoop:
wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz - HBase:
wget https://archive.apache.org/dist/hbase/2.4.9/hbase-2.4.9-bin.tar.gz。
- Hadoop:
2. 安装与配置Hadoop
- 解压Hadoop:将Hadoop解压至
/usr/lib/hadoop(或其他指定目录):
tar -zxvf hadoop-3.3.4.tar.gz -C /usr/lib/hadoop/。 - 配置环境变量:编辑
/etc/profile,添加以下内容(替换版本号为实际版本):运行export HADOOP_HOME=/usr/lib/hadoop/hadoop-3.3.4 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbinsource /etc/profile使配置生效。 - 配置核心文件:
- core-site.xml(
$HADOOP_HOME/etc/hadoop/core-site.xml):设置HDFS的默认URI,指向本地NameNode:<property> <name>fs.defaultFSname> <value>hdfs://localhost:9000value> property> - hdfs-site.xml(
$HADOOP_HOME/etc/hadoop/hdfs-site.xml):配置HDFS副本数(单节点设为1):<property> <name>dfs.replicationname> <value>1value> property>
- core-site.xml(
- 启动Hadoop集群:
- 格式化NameNode(首次启动需执行):
hadoop namenode -format。 - 启动HDFS和YARN:
start-dfs.sh && start-yarn.sh。 - 验证启动:运行
jps,应看到NameNode、DataNode、ResourceManager、NodeManager等进程。
- 格式化NameNode(首次启动需执行):
3. 安装与配置HBase
- 解压HBase:将HBase解压至
/usr/lib/hbase(或其他指定目录):
tar -zxvf hbase-2.4.9-bin.tar.gz -C /usr/lib/hbase/。 - 配置环境变量:编辑
/etc/profile,添加以下内容:运行export HBASE_HOME=/usr/lib/hbase/hbase-2.4.9 export PATH=$PATH:$HBASE_HOME/bin:$HBASE_HOME/sbinsource /etc/profile使配置生效。 - 配置核心文件:
- hbase-env.sh(
$HBASE_HOME/conf/hbase-env.sh):设置Java路径:export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64 - hbase-site.xml(
$HBASE_HOME/conf/hbase-site.xml):配置HBase与Hadoop、ZooKeeper的集成:<configuration> <property> <name>hbase.rootdirname> <value>hdfs://localhost:9000/hbasevalue> property> <property> <name>hbase.cluster.distributedname> <value>truevalue> property> <property> <name>hbase.zookeeper.property.dataDirname> <value>/var/lib/zookeepervalue> property> <property> <name>hbase.zookeeper.quorumname> <value>localhostvalue> property> configuration>
- hbase-env.sh(
- 创建ZooKeeper数据目录:运行
sudo mkdir -p /var/lib/zookeeper,并设置权限:sudo chown -R $USER:$USER /var/lib/zookeeper。
4. 启动与验证集成
- 启动HBase:进入HBase的
bin目录,运行./start-hbase.sh。 - 验证进程:运行
jps,应看到HMaster和HRegionServer进程(分布式模式下会有多个HRegionServer)。 - 访问Web UI:打开浏览器,访问
http://localhost:16010(HBase默认端口),查看集群状态。 - 测试功能:进入HBase shell(
./hbase shell),执行以下命令验证:create 'test_table', 'cf' # 创建表 put 'test_table', 'row1', 'cf:name', 'John' # 插入数据 get 'test_table', 'row1' # 查询数据 exit # 退出shell
注意事项
- 版本兼容性:确保HBase与Hadoop版本兼容(如HBase 2.4.x兼容Hadoop 3.3.x),避免因版本冲突导致启动失败。
- 配置文件同步:若为分布式集群,需将Hadoop和HBase的配置文件同步到所有节点。
- 权限问题:确保Hadoop和HBase的数据目录(如HDFS的
/hbase、本地/var/lib/zookeeper)具有正确的读写权限。 - 防火墙设置:若为远程访问,需开放Hadoop(9000、50070等)和HBase(16010等)的相关端口。
以上就是关于“HBase与Hadoop在Debian上如何集成”的相关介绍,筋斗云是国内较早的云主机应用的服务商,拥有10余年行业经验,提供丰富的云服务器、租用服务器等相关产品服务。云服务器资源弹性伸缩,主机vCPU、内存性能强悍、超高I/O速度、故障秒级恢复;电子化备案,提交快速,专业团队7×24小时服务支持!
简单好用、高性价比云服务器租用链接:https://www.jindouyun.cn/product/cvm