阅读量:2
Ubuntu Hadoop 数据恢复实操指南
一、先判断可用恢复路径
- 检查回收站:执行
hadoop fs -ls /user/$USER/.Trash/Current或hdfs dfs -ls /user/$USER/.Trash/Current,若能看到被删文件,直接从回收站 mv 回原路径即可。回收站是否生效取决于参数 fs.trash.interval(为 0 表示关闭)。 - 检查快照:执行
hdfs lsSnapshottableDir查看目录是否已启用快照;已启用时,快照位于.snapshot子目录下,可用快照将文件/目录拷贝回原位置。 - 若回收站已过期且未配置快照,需转向备份或元数据级恢复(见下文)。
二、方法一 回收站恢复(最快)
- 适用前提:已启用回收站且未超过保留时间。删除文件时一般会提示“Moved to trash at: hdfs://…/user/用户名/.Trash/Current”。
- 操作步骤:
- 查找文件
hadoop fs -ls /user/$USER/.Trash/Current/... - 恢复到原路径
hadoop fs -mv /user/$USER/.Trash/Current/.../your_file /your/original/path
- 查找文件
- 配置要点(如未启用需先在 core-site.xml 中开启并重启相关服务或客户端生效):
fs.trash.interval:保留时间(分钟),0 为关闭;fs.trash.checkpoint.interval:检查点间隔(分钟),应 ≤ 上一个值。
- 示例(保留 1 天):
提示:回收站是用户级机制,文件实际位于 /user/用户名/.Trash/Current。fs.trash.interval 1440 fs.trash.checkpoint.interval 1440
三、方法二 快照恢复(时间点恢复)
- 适用前提:目标目录已通过
hdfs dfsadmin -allowSnapshot开启快照功能,并且删除前已创建过快照。 - 常用命令:
- 开启快照:
hdfs dfsadmin -allowSnapshot - 创建快照:
hdfs dfs -createSnapshot[snapshotName] - 列出快照:
hdfs dfs -ls/.snapshot - 比较差异:
hdfs snapshotDiff(结果中 + 创建、- 删除、M 修改、R 重命名) - 恢复文件/目录:
- 文件:
hdfs fs -cp/.snapshot/ /your_file /your/original/path - 目录:
hdfs fs -cp -r/.snapshot/ /your_dir /your/original/path
- 文件:
- 开启快照:
- 快照特性:创建为瞬时操作(复杂度 O(1)),仅在发生修改时占用少量内存(O(M)),不复制数据块,对线上影响小。
四、方法三 无回收站无快照时的恢复路径
- 元数据级恢复(有历史备份时):
- 立即停止集群(尤其是 NameNode),避免继续写入导致旧块被覆盖;
- 从备份中选取删除时间点之前的 fsimage 与必要的 edits;
- 在隔离环境加载该 fsimage 验证一致性;
- 确认无误后,将恢复后的命名空间导回或切换到新集群,再按需从其他可用副本/备份补充数据。
- 注意:HDFS 的 SecondaryNameNode/Checkpoint 仅用于定期合并 fsimage 与 edits,并非完整备份;若无可用的历史 fsimage 备份,元数据级恢复不可行。
- 不建议依赖本地磁盘文件恢复工具(如 TestDisk/PhotoRec):HDFS 数据多块分散在 DataNode 上,且可能已触发副本重建,这类工具通常难以保证一致性。
五、预防与运维建议
- 长期开启并合理设置回收站:建议 fs.trash.interval ≥ 1440(1 天),
fs.trash.checkpoint.interval≤ 该值,便于误删回滚。 - 为关键目录建立滚动快照策略:定期
createSnapshot,用snapshotDiff做变更审计,必要时快速回滚。 - 建立多副本与跨集群/跨地域备份:结合 DistCp 定期镜像关键目录到独立集群或对象存储,作为最后防线。
- 权限与审计:最小化删除权限,开启审计日志,结合告警,降低误删概率与影响范围。
以上就是关于“Ubuntu Hadoop 怎样进行数据恢复”的相关介绍,筋斗云是国内较早的云主机应用的服务商,拥有10余年行业经验,提供丰富的云服务器、租用服务器等相关产品服务。云服务器资源弹性伸缩,主机vCPU、内存性能强悍、超高I/O速度、故障秒级恢复;电子化备案,提交快速,专业团队7×24小时服务支持!
简单好用、高性价比云服务器租用链接:https://www.jindouyun.cn/product/cvm