Как Presto работает с реляционной базой данных

Я пытаюсь узнать о PrestoDB, и у меня есть база данных MySql. Эта база данных представляет собой относительно небольшую базу данных, и я использую, чтобы понять, как presto работает с соединениями JDBC.

Я уже использовал presto для подключения к хранилищу метаданных Hive, и я понял, как он работает с файлами ORC, как рабочие presto берут данные и запускают запрос по мере необходимости.

Этот образ мне действительно понятен:

Presto + Hive

Действительно ясно, как распараллеливание будет работать с этой моделью.

Но в соединении MySql, как распараллелить данные с реляционной базой данных? Perst загружает таблицы рабочим, а затем выполняет запрос?

Или просто запустить запрос в MySQL и создать интерфейс результата?


person Thiago Baldim    schedule 11.04.2017    source источник


Ответы (1)


Presto создает одно соединение JDBC и извлекает данные из MySQL в однопоточном режиме.

В будущем Presto сможет распараллеливать получение данных из MySQL, если данные разделены (создавая отдельное соединение JDBC для каждого раздела).

person Christina Wallin    schedule 11.04.2017