Вопросы по теме 'azure-synapse'

Копирование данных в Azure SQL DW с помощью ADF (поэтапное копирование с использованием Polybase не работает согласно документации)
Попытка загрузить CSV-файлы из озера данных (поколение 2) в Azure Synapse с помощью фабрики данных Azure. В исходном файле есть escape-символ "(двойная кавычка). Это выходит за рамки ограничений данных, связанных с прямым подключением polybase к Data...
367 просмотров

Создание внешнего источника данных в Azure Synapse Analytics (хранилище данных SQL Azure) для Oracle
Я пытаюсь создать внешний источник данных в Azure Synapse Analytics (хранилище данных SQL Azure) для внешней базы данных Oracle. Для этого я использую следующий код в SSMS: CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'myPassword'; CREATE DATABASE...
1062 просмотров

Службы Azure Analysis Services и Synapse Analytics
Может ли кто-нибудь объяснить, в чем разница между службами Azure Analysis Services и Azure Synapse Analytics? Зачем использовать службы Analysis Services вместо Synapse Analytics? Спасибо,
5721 просмотров

Извлечение и преобразование данных из локального MySQL в хранилище данных Azure Synapse
Я пытаюсь настроить демонстрационное хранилище данных в Azure Synapse. Я хотел бы извлечь данные из локальной базы данных MySQL, преобразовать и агрегировать некоторые данные и сохранить их в таблицах фактов / измерений в Azure Synapse Analytics....
293 просмотров

Ошибка фабрики данных Azure - строковые или двоичные данные будут усечены.
Я создаю свой первый конвейер фабрики данных, очень простой. У меня есть поток данных с только источником (плоский файл csv) и приемником (таблица синапсов). В источнике 12 столбцов. Итак, я создал таблицу в Synapse (через SSMS) со всеми 12...
1494 просмотров
schedule 29.10.2022

Массовая вставка фрейма данных PySpark в Azure Synapse из записной книжки Python Databricks
Пакетное использование У меня есть фреймворк PySpark, состоящий из 750+ столбцов и 2,5 млн записей, что составляет примерно 6,5 ГБ. Я выполняю массовую вставку (пакетную) из записной книжки Python Databricks в таблицу Azure Synapse. Ниже приведен...
542 просмотров

Как сохранить снимок пула SQL Azure Synapse (хранилища данных) в другой подписке Active Directory?
В Azure Active Directory (ABC) есть хранилище данных (пул Azure Synapse SQL). В целях обучения мы хотели создать такую ​​же копию в другом Azure Active Directory (XYZ). В настоящее время мне не удалось найти ни одной опции для сохранения точки...
266 просмотров

Ошибка выдачи DataFrame.show () в Databricks
Я пытаюсь получить данные из хранилища данных Azure с помощью Azure Databricks. Часть подключения хороша, поскольку я вижу строки, возвращаемые в DataFrame, но когда я пытаюсь сохранить или показать запись в DataFrame, возникает ошибка. Вот что я...
451 просмотров

Можно ли переименовать пул SQL Azure Synapse?
Я использую базу данных SQL Azure для отчетности нашей команды, и размер данных сейчас слишком велик для обработки отдельными данными (по крайней мере, я так думаю, у нее есть 2 таблицы фактов с примерно 100 миллионами строк в каждой таблице). База...
691 просмотров
schedule 11.08.2023

Загрузка Azure Synapse: разделение сжатых файлов большого размера на сжатые файлы меньшего размера
Я получаю эту рекомендацию от Azure Synapse. Подробная информация о рекомендации Мы обнаружили, что вы можете увеличить пропускную способность, разделив сжатые файлы, которые хранятся в вашей учетной записи хранения. Хорошее практическое правило -...
101 просмотров
schedule 18.02.2022

Azure Synapse Serverless - SQL-запрос для возврата строк в каталоге для каждого файла
У меня есть контейнер Azure Data Lake Gen2, в котором есть несколько файлов json. Я хотел бы написать запрос, который возвращает запись для каждого файла. Я не заинтересован в синтаксическом анализе файлов, я просто хочу знать, какие файлы там есть,...
114 просмотров
schedule 27.03.2023

Вопрос управления доступом по ADLS для бессерверного пула Azure Synapse Analytics для подключения и запроса
У меня есть пул без сервера Azure Analytics (где я являюсь администратором). У меня также есть доступ к ADLS Gen-2 через ACL (список управления доступом) для определенного списка папок [На изображении ниже - все зеленые поля представляют доступ,...
202 просмотров

Заполнение Spark Dataframe
Я хотел бы выполнить операцию типа заполнения в кадре данных, чтобы удалить нули и убедиться, что последняя строка является своего рода сводной строкой, содержащей последние известные значения для каждого столбца на основе timestamp , сгруппированные...
69 просмотров
schedule 29.09.2023

Дельта только для чтения между 2 версиями deltaLake
Есть ли способ прочитать только дельту между двумя версиями deltaLake? конкретно в синапсе я пытался %%pyspark import delta from pyspark.sql.functions import col, asc df_delta = spark.read.format("delta") \...
52 просмотров