У меня очень большой набор данных, около 500 миллионов ребер, в котором нужно пройти почти все ребра. Я пытаюсь распараллелить эти обходы, пытаясь разбить на страницы IDS. Моя стратегия заключалась в том, чтобы попытаться разбить на страницы по идентификатору, который является хешем MD5. Я пробовал такие запросы:
g.E().hasLabel('foo').has(id, TextP.startingWith('AAA'))
для страницы 1 g.E().hasLabel('foo').has(id, TextP.startingWith('AAB'))
для страницы 2
Но кажется, что каждый запрос выполняет полное сканирование, а не только подмножество. Как вы рекомендуете использовать нумерацию страниц?