Гретл не прогнозирует тестовые данные

У меня есть файл данных поезда в Gretl, а затем я добавляю файл тестовых данных, в котором отсутствуют данные SalePrice, поэтому я хочу предсказать SalePrice для этих строк, но досадно, если я добавлю журнал для одной из переменных (существует в обоих файлах без пропущенных значений , всего несколько нулей), то прогноз не предсказывает никаких значений для второго файла. Если я попробую эту переменную журнала, то проблем не будет. Ты хоть представляешь, почему это? Я пробовал также из командной строки с помощью команды fcast к новой переменной, но не помогло.

введите описание изображения здесь

введите описание изображения здесь

Загрузите запрошенные команды:  введите здесь описание изображения  введите описание изображения здесь


person Georgi    schedule 31.07.2018    source источник


Ответы (1)


Было бы лучше, если бы мы могли увидеть ваш набор данных, чтобы лучше понять суть дела. Но теперь я могу подумать о некоторых возможностях:

  1. Отсутствующие значения в ваших регрессорах;
  2. Вы используете запаздывающую цену SalePrice и применяете журнал в подвыборке, поэтому будущие значения недоступны.

Не могли бы вы запустить этот код и поделиться результатом?

eval lastobs(YearRemodAdd)
eval lastobs(KitchenAbvGr)
eval lastobs(GarageCars)
eval lastobs(Fireplaces)
eval lastobs(l_GrLivArea)
eval lastobs(YearBuiltSQ2)
eval lastobs(l_TotalBsmtSF)

smpl full

eval lastobs(YearRemodAdd)
eval lastobs(KitchenAbvGr)
eval lastobs(GarageCars)
eval lastobs(Fireplaces)
eval lastobs(l_GrLivArea)
eval lastobs(YearBuiltSQ2)
eval lastobs(l_TotalBsmtSF)

fcast phat1
person Henrique Andrade    schedule 31.07.2018
comment
Только что загруженный экран. По-прежнему не удается сделать прогноз для тестового файла. Как видите, последний столбец как для обучающего, так и для тестового файла - SalePrice. Итак, после добавления тестового файла я создаю несколько новых переменных, которые, как я вижу, создаются для обоих файлов. Дайте мне знать, если что-то непонятно, поэтому не вижу проблемы. Phat1 и 2 - это переменные, в которых я ожидаю значений frecast. Я использую консоль для прогнозов и нормально все работает .. - person Georgi; 01.08.2018
comment
Кстати. Если я удалю только переменную l_TotalBsmtSF (исключить из модели, но не удалить переменную), тогда все будет в порядке, поэтому я действительно не понимаю - person Georgi; 01.08.2018
comment
Спасибо, Энрике. Я только что загрузил экран запрошенных команд. Кстати, я обнаружил, что есть 1 строка TotalBsmtSF со значением «NA», но даже я редактирую ее до числового значения, это та же проблема. Я нашел временное решение для предварительного создания журнала этого столбца в Excel, но это глупо, и даже квадрат Adj R немного упал. - person Georgi; 02.08.2018