В чем разница между подключением Azure Data Lake Store Gen2 к Databricks с использованием предварительной службы и прямого доступа с использованием ключа SAS?
Я хочу знать разницу в сроках передачи данных, безопасности доступа
Спасибо
В чем разница между подключением Azure Data Lake Store Gen2 к Databricks с использованием предварительной службы и прямого доступа с использованием ключа SAS?
Я хочу знать разницу в сроках передачи данных, безопасности доступа
Спасибо
Если вы смонтируете хранилище, все пользователи на всех кластерах получат доступ.
Если вы не монтируете и не подключаетесь непосредственно в сеансе с использованием субъекта-службы или SAS (я не думаю, что ключ SAS официально поддерживается, BTW), пользователь в этом сеансе должен иметь доступ к учетным данным для создания подключения.
Руководители служб также могут иметь низкоуровневые разрешения, применяемые в озере, такие как ограничение доступа к определенным папкам.
Обратите внимание, что с ADLS Gen2 теперь у вас также есть возможность передавать учетные данные пользователя: https://docs.azuredatabricks.net/spark/latest/data-sources/azure/adls-passthrough.html
Никаких отличий в производительности не знаю.