У нас есть кластер hadoop+hbase на amazon EMR с конфигурацией по умолчанию, так что mapred.child.tmp
и hbase.tmp.dir
указывают на /tmp
. Наш кластер работает некоторое время, и теперь /tmp
составляет 500 Гб, по сравнению с 70 Гб для реальных данных /hbase
.
Такая разница кажется слишком большой, мы должны периодически удалять некоторые из /tmp
данных?