Контрольные показатели службы передачи данных BigQuery для данных Менеджера кампаний

Здесь есть полезная информация об общем времени передачи провод для передачи данных в / из различных источников.

Помимо времени передачи необработанных данных, я пытаюсь приблизительно оценить, сколько времени потребуется для импорта ~ 12 ТБ в день в BigQuery с помощью службы передачи данных BigQuery для DoubleClick Campaign Manager.

Это где-нибудь задокументировано?


person Corey Maher    schedule 16.04.2019    source источник


Ответы (1)


В первой ссылке, которой вы поделились, есть изображение , который показывает скорость передачи (приблизительную) в зависимости от пропускной способности сети.

введите описание изображения здесь

Допустим, у вас есть пропускная способность 1 Гбит / с, тогда данные будут доступны в вашем проекте GCP примерно через 30 часов, поскольку вы передаете 12 ТБ, что близко к 10 ТБ. Таким образом, перевод занимает полтора дня.

Если вы действительно хотите передавать 12 ТБ в день, потому что вам нужно, чтобы эти данные были доступны каждый день, а увеличение пропускной способности невозможно, я бы порекомендовал вам пакетировать данные и создавать разные службы передачи для каждого пакета. В качестве примера:

  • Разделите 12 ТБ на 12 пакетов по 1 ТБ -> 12 заданий передачи по 1 ТБ каждое
  • На выполнение каждого пакета уйдет 3 часа, поэтому вам будет доступно 8/12 ТБ в день.

Это можно применить к меньшим пакетам данных, если вы хотите получить более детальное решение.

person bhito    schedule 08.08.2019