阅读量:4
在Debian上管理Hadoop日志可参考以下方法:
-
日志文件位置
- 默认存放在Hadoop安装目录下的
logs文件夹,可通过hadoop-env.sh中HADOOP_LOG_DIR配置自定义路径。 - YARN应用日志默认存储在HDFS的
/tmp/logs目录,可通过yarn-site.xml配置yarn.nodemanager.remote-app-log-dir修改。
- 默认存放在Hadoop安装目录下的
-
查看日志
- 系统日志:使用
journalctl命令(如journalctl -u hadoop查看特定服务日志)。 - 文本工具:用
cat、less、grep等命令直接查看日志文件。 - Web界面:通过Hadoop ResourceManager的Web界面查看作业日志。
- 系统日志:使用
-
日志聚合
- 在
yarn-site.xml中启用yarn.log-aggregation-enable=true,并设置保留时间(如yarn.log-aggregation.retain-seconds=172800,单位为秒)。
- 在
-
日志轮转与清理
- 使用
logrotate工具配置日志轮转、压缩和删除策略,避免日志占满磁盘。
- 使用
-
高级分析
- 用ELK(Elasticsearch+Logstash+Kibana)或Apache Solr进行日志的实时分析和可视化。
-
日志级别调整
- 修改
log4j.properties文件(路径:$HADOOP_HOME/etc/hadoop/),设置log4j.rootLogger等级(如DEBUG、ERROR),修改后重启Hadoop服务生效。
- 修改
以上就是关于“Debian上Hadoop日志管理怎么做”的相关介绍,筋斗云是国内较早的云主机应用的服务商,拥有10余年行业经验,提供丰富的云服务器、租用服务器等相关产品服务。云服务器资源弹性伸缩,主机vCPU、内存性能强悍、超高I/O速度、故障秒级恢复;电子化备案,提交快速,专业团队7×24小时服务支持!
简单好用、高性价比云服务器租用链接:https://www.jindouyun.cn/product/cvm