Я использую кластер с установленным 1 центром обработки данных (10 узлов) и Cassandra 2.1.7 на каждом. Мы используем SimpleStretegy (старая ошибка).
Ситуация такова, что я не выполнял никаких ремонта nodetool с самого начала, и теперь есть данные примерно 200 ГБ с 3 RF.
Так как выполнение полного восстановления или инкрементного восстановления на данном этапе одинаково. Итак, я попытался выполнить полный ремонт. Но это приводит к отключению узла координатора.
В итоге я выполняю восстановление полного диапазона разделов (nodetool repair -pr) на каждом узле по одному. Но это занимает слишком много времени (15+ часов для каждого узла, следовательно, недели для всех узлов).
Я делаю это неправильно, или это должно было случиться? Или это проблема версии?
В будущем, если я снова проведу полный ремонт после этого, займет ли это еще несколько недель?