Я работаю над набором данных с несколькими отсутствующими значениями в его атрибутах.
Выполнив типичную процедуру предварительной обработки данных, мой следующий шаг — попытаться подогнать регрессионную модель для вменения пропущенных значений. Однако, когда я пытаюсь использовать IterativeImputer
из fancyimpute
. Я сталкиваюсь с этой ошибкой:
C:\Users\User.DC241-12\Anaconda3\lib\site-packages\sklearn\linear_model\ridge.py:942: RuntimeWarning: overflow encountered in square
v = s ** 2
****hierarchy of filenames in which error is happening****
Input contains NaN, infinity or a value too large for dtype('float64')
Я понимаю, что отсутствующие значения, вводимые в IterativeImputer
, должны быть представлены как NaN
s, поэтому я думаю, что это не причина. Должен ли я масштабировать свои данные, прежде чем переходить к процессу вменения. Но не повлияет ли это на процесс вменения?
Спасибо!