Я новичок в науке о данных. Извините, если вопрос неясен.
**My Data is following format:**
*year age_group pop Gender Ethnicity
0 1957 0 - 4 Years 264727 Mixed Mixed
1 1957 5 - 9 Years 218097 Male Indian
2 1958 10 - 14 Years 136280 Female Indian
3 1958 15 - 19 Years 135679 Female Chinese
4 1959 20 - 24 Years 119266 Mixed Mixed*
.
.
. .
Здесь «Смешанный» означает «мужской и женский» для пола, а также «индейцы, китайцы и другие» для этнической принадлежности, где поп-это население.
У меня есть несколько строк с отсутствующими значениями, например:
year age_group pop Gender Ethnicity
344 1958 70 - 74 Years NaN Mixed Mixed
345 1958 75 - 79 Years NaN Male Indian
346 1958 80 - 84 Years NaN Mixed Mixed
349 1958 75 Years & Over NaN Mixed Mixed
350 1958 80 Years & Over NaN Female Chinese
.
.
.
Их нельзя удалить или заполнить средними/медианными/предыдущими значениями.
Я ищу любую холодную колоду / любые методы вменения, которые позволили бы мне заполнить поп-музыку на основе значений года, возрастной группы, пола и этнической принадлежности.
Пожалуйста, предоставьте любой пример кода или документацию, которая поможет мне.