У меня есть набор данных (вектор numpy) с 50 classes
и 9000 обучающих примеров.
x_train=(9000,2048)
y_train=(9000,) # Classes are strings
classes=list(set(y_train))
Я хотел бы создать поднабор данных таким образом, чтобы каждый класс имел 5 примеров.
что означает, что я получаю 5*50=250
обучающих примера. Следовательно, мой поднабор данных будет иметь следующую форму:
sub_train_data=(250,2048)
sub_train_labels=(250,)
Примечание: мы берем случайным образом по 5 примеров из каждого класса (общее количество классов = 50)
Спасибо