У меня есть набор данных [1000 x 80] из 1000 точек данных, каждая из которых имеет 80 значений переменных. Я должен линейно регрессировать две переменные: цену и площадь, и определить 5 точек данных, которые имеют самые высокие квадраты остатков. Для этих идентифицированных точек данных я должен отобразить 4 из 80 значений переменных.
Я не знаю, как использовать остатки для определения исходных точек данных. Все, что у меня есть на данный момент, это:
model_lm <- lm(log(price) ~ log(area), data = ames)
Могу ли я получить некоторые рекомендации о том, как я могу подойти к вышеуказанной проблеме