У меня есть случай использования, когда я читаю элементы новой строки json, хранящиеся в облачном хранилище Google, и начинаю обрабатывать каждый json. При обработке каждого json я должен вызывать внешний API для дедупликации, был ли этот элемент json обнаружен ранее. Я делаю ParDo
с DoFn
для каждого json.
Я не видел ни одного онлайн-руководства, в котором говорилось бы, как вызвать внешнюю конечную точку API из apache beam DoFn
Dataflow.
Я использую JAVA
SDK Beam. В некоторых инструкциях, которые я изучал, объясняется, что использование startBundle
и FinishBundle
, но я не понимаю, как его использовать