Какие алгоритмы используются в пакете pROC для анализа ROC?

Я пытаюсь выяснить, какие алгоритмы используются в пакете pROC для проведения анализа ROC. Например, какой алгоритм соответствует условию «алгоритм == 2»? Я только недавно начал использовать R в сочетании с Python из-за простоты поиска оценок CI, результатов тестирования значимости и т. Д. Мой код Python использует линейный дискриминантный анализ для получения результатов по проблеме двоичной классификации. При использовании пакета pROC для вычисления оценок доверительного интервала для AUC, чувствительности, специфичности и т. Д. Все, что мне нужно сделать, это загрузить мои данные и запустить пакет. AUC, которую я получаю при использовании pROC, совпадает с AUC, возвращаемым моим кодом Python, который использует линейный дискриминантный анализ (LDA). Чтобы иметь возможность сообщать о согласованных результатах, я пытаюсь выяснить, является ли LDA одним из вариантов алгоритма в pROC? Любые идеи по этому поводу или о том, как это выяснить, были бы очень полезны. Где я могу получить доступ к исходному коду для pROC?


person sam    schedule 02.04.2019    source источник


Ответы (1)


Основные алгоритмы pROC описаны в статье 2011 BMC Bioinformatics. Некоторые добавленные позже алгоритмы описаны в руководстве в формате PDF. Как и любой пакет CRAN, исходный код доступен на странице пакета CRAN < / а>. Как и многие пакеты R в наши дни, они также доступны на GitHub.

Чтобы конкретно ответить на ваш вопрос, к сожалению, у меня нет хорошей ссылки на алгоритм для вычисления точек кривой ROC с algorithm 2. Глядя на него, вы поймете, что он в конечном итоге эквивалентен стандартному алгоритму кривой ROC, хотя и более эффективен, когда количество порогов увеличивается, как я попытался объяснить в этом ответе на вопрос о перекрестной проверке. Но вы должны поверить мне (и большинству пакетов, рассчитывающих кривые ROC).

Какой двоичный классификатор вы используете, будь то LDA или другой, не имеет отношения к ROC-анализу и выходит за рамки pROC. ROC-анализ - это общий способ оценки прогнозов, оценок или, в более общем смысле, сигнала, исходящего из двоичного классификатора. Он не оценивает сам двоичный классификатор или детектор сигналов, а только сам сигнал. Это позволяет очень легко сравнивать различные методы классификации и способствует успеху анализа ROC в целом.

person Calimo    schedule 03.04.2019