с Python доктора Элвина Анга
https://www.alvinang.sg/s/results.csv
Цель
Мы покажем, что если студент изучает что-либо более 3 часов, у него будет высокий шанс ожидаемого прохождения.
Шаг 1. Импорт набора данных
1a) Импорт библиотек
1b) Импорт результатов.csv
1c) Отображение Fail на 0 и Pass на 1
Шаг 2: Построение
2a) График количества неудач и проходов
2b) Участок проходит/не проходит по сравнению с количеством часов обучения
2c) Постройте кривую логистической регрессии
Шаг 3: Тренировка тестового сплита
3a) Удалите столбец StudentID
3b) Разделить на «x: часы» и «y: результат»
3c) Тренировочный тестовый сплит
3d) Импорт модели логистической регрессии
3e) Обучение модели
3f) Проверка двоичных классов
3g) Предсказать набор данных X_test
Шаг 4: Метрики
4a) Матрица путаницы
4b) Оценка точности
4c) Отчет о классификации
Шаг 5: Новый прогноз с использованием нового значения
О докторе Элвине Анге
Доктор Элвин Анг получил степень доктора философии, магистра и бакалавра в NTU, Сингапур. Ранее он был главным консультантом (наука о данных), а также доцентом. Он также был адъюнкт-лектором SUSS в течение 8 лет. Его внимание и интерес сосредоточены в области науки о данных в реальном мире. Хотя по образованию он операционный исследователь, его страсть к практическим применениям перевешивает его академическое образование. Он ученый, предприниматель, а также личный/деловой консультант.
Подробнее о нем на www.AlvinAng.sg.