Согласно docos Dataproc, он имеет «встроенную и автоматическую интеграцию с BigQuery em > ".
У меня есть таблица в BigQuery. Я хочу прочитать эту таблицу и выполнить некоторый анализ, используя созданный мною кластер Dataproc (используя задание PySpark). Затем запишите результаты этого анализа обратно в BigQuery. Вы можете спросить: «Почему бы просто не провести анализ напрямую в BigQuery !?» - причина в том, что мы создаем сложные статистические модели, а SQL слишком высок для их разработки. Нам нужно что-то вроде Python или R, следовательно, Dataproc.
Доступны ли какие-либо примеры Dataproc + BigQuery? Я ничего не могу найти.