Публикации по теме 'imbalanced-data'


Влияние SMOTE на точность
Несбалансированные наборы данных распространены в реальном мире. Устранение этих дисбалансов представляет собой сложную задачу. Например, в прогнозе погашения кредита из 100 случаев может быть менее 20 неплательщиков. Когда эти данные передаются через любую модель для прогнозирования неплательщиков, точность будет очень низкой, поскольку данные смещены в сторону недефолтеров. Чтобы справиться с такими сценариями, мы можем использовать методы повторной выборки. Ниже приведены несколько..