У меня есть следующий сценарий:
- Pipeline A looks up table A in BigQuery, does some computation and returns a list of column names.
- This list of columns names is used as the BigQuery schema for output of pipeline B.
Не могли бы вы сообщить мне, что является лучшим вариантом для достижения этого?
Может ли конвейер A использовать TextIO для записи списка имен столбцов во временные или промежуточные файлы местоположения, которые затем считываются исполнителем конвейера для определения схемы для конвейера B. Если этот подход выглядит нормально, не могли бы вы сообщить мне, есть ли Утилита потока данных для чтения файлов из временного или промежуточного местоположения или если следует использовать GCS API.