Я хотел бы разделить коллекцию PCollection в Apache Beam с помощью Python по определенному полю.
Я нашел следующий код в документации Python SDK, который разбивает коллекцию PCollection на
students = ...
def partition_fn(student, num_partitions):
return int(get_percentile(student) * num_partitions / 100)
by_decile = students | beam.Partition(partition_fn, 10)
Но это не то, что я хочу делать. Есть ли способ сделать это?