У меня огромные таблицы в кассандре, более 2 миллиардов строк и все больше. В строках есть поле даты, и оно следует шаблону сегмента даты, чтобы ограничить каждую строку.
Даже тогда у меня есть более миллиона записей на конкретную дату.
Я хочу читать и обрабатывать строки за каждый день как можно быстрее. Что я делаю, так это получаю экземпляр com.datastax.driver.core.ResultSet
и получаю от него итератор и делюсь этим итератором между несколькими потоками.
Итак, по сути, я хочу увеличить пропускную способность чтения. Это правильный путь? Если нет, пожалуйста, предложите лучший способ.