hive 异常任务中间数据清理

9,125次阅读
没有评论

共计 479 个字符,预计需要花费 2 分钟才能阅读完成。

hive 在运行过程中,会发现 hdfs /tmp/hive/hive or hdfs 目录占用空间巨大!
hive 在运行过程中会生产大量的中间会话在 /tmp 目录下,
如果 hive 正常运行结束,临时会话会被自动清理掉,
如果 hive 中断,或者异常退出,这些中间会话就会一直保存在 hdfs 上。必须手动清理掉!

#!/bin/bash

usage=“Usage: cleanup.sh [days]”
if [!“$1”]
then
echo $usage
exit 1
fi

now=$(date +%s)
hadoop fs -ls /tmp/hive/hdfs | grep“^d”| while read f; do
dir_date=echo $f | awk '{print $6}'
difference=$((( $now –

(

d

a

t

e

d

(date -d ”

(dateddir_date” +%s) ) / (24 * 60 * 60) ))
if [$difference -gt $1]; then
echo $f
hadoop fs -rm -r -skipTrash echo $f| awk '{print $8}';
fi
done

原文地址: hive 异常任务中间数据清理

    正文完
     0
    Yojack
    版权声明:本篇文章由 Yojack 于2024-11-29发表,共计479字。
    转载说明:
    1 本网站名称:优杰开发笔记
    2 本站永久网址:https://yojack.cn
    3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
    4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
    5 本站所有内容均可转载及分享, 但请注明出处
    6 我们始终尊重原创作者的版权,所有文章在发布时,均尽可能注明出处与作者。
    7 站长邮箱:laylwenl@gmail.com
    评论(没有评论)