Оглавление
- Общие сведения
- Ресурсы для интервью
- Искусственный интеллект
- Генетические алгоритмы
- Статистика
- Полезные блоги
- Ресурсы на Quora
- Ресурсы на Kaggle
- Шпаргалки
- Классификация
- Линейная регрессия
- Логистическая регрессия
- Проверка модели с использованием повторной выборки
- Перекрестная проверка
- Самозагрузка
- Глубокое обучение
- Фреймворки
- Сети прямой связи
- Рекуррентные нейронные сети, LSTM, GRU
- Ограниченная машина Больцмана, DBN
- Автокодировщики
- Сверточные нейронные сети
- Обработка естественного языка
- Тематическое моделирование, LDA
- Word2Vec
- Компьютерное зрение
- Машина опорных векторов
- Обучение с подкреплением
- Дерева решений
- Случайный лес/бэггинг
- Повышение
- Ансамбли
- Модели стекирования
- Параметры ВК
- Байесовское машинное обучение
- Частично контролируемое обучение
- Оптимизация
Общие вещи
- Подборка лучших фреймворков, библиотек и программного обеспечения для машинного обучения
- Подборка лучших библиотек и ресурсов для визуализации данных.
- Потрясающий репозиторий Data Science для изучения и применения для решения реальных проблем
- Мастера науки о данных с открытым исходным кодом
- Часто задаваемые вопросы о машинном обучении на перекрестной проверке
- Список курсов Университета машинного обучения
- Алгоритмы машинного обучения, в которых вы всегда должны хорошо разбираться
- Разница между линейно независимыми, ортогональными и некоррелированными переменными
- Список концепций машинного обучения
- Слайды по нескольким темам машинного обучения
- Слайды лекций по машинному обучению в Массачусетском технологическом институте
- Сравнение алгоритмов обучения с учителем
- Изучаем основы науки о данных
- Ошибки машинного обучения, которых следует избегать
- Курс по статистическому машинному обучению
- Примечания и коды The AnalyticsEdge edX
Ресурсы для интервью
- Как аспиранту информатики подготовиться к собеседованию с учеными данных?
- Как научиться машинному обучению?
- Часто задаваемые вопросы об интервью по науке о данных
- Каковы ключевые навыки специалиста по данным?
Искусственный интеллект
- Потрясающий искусственный интеллект (GitHub Repo)
- edX курс | Кляйн и Аббил
- Курс Удасити | Норвиг и Трун
- TED говорит об ИИ
Генетические алгоритмы
- Страница генетических алгоритмов в Википедии
- Простая реализация генетических алгоритмов на Python (Часть 1), Часть 2
- Генетические алгоритмы против искусственных нейронных сетей
- Генетические алгоритмы, объясненные простым языком
- Генетическое программирование
- Генетическое программирование на Python (GitHub)
- Генетические алгоритмы против генетического программирования (Quora), StackOverflow
Статистика
- Веб-сайт Stat Trek — специальный веб-сайт для самостоятельного обучения статистике.
- Изучите статистику с помощью Python — изучите статистику, используя подход к программированию, ориентированный на приложения.
- Статистика для хакеров | Слайды | @jakevdp — Слайды Джейка ВандерПласа
- Онлайн-книга статистики — интерактивный мультимедийный курс по изучению статистики
- Что такое выборочное распределение?
- Учебники
- Учебник по статистике AP
- Учебник по статистике и вероятностям
- Учебник по матричной алгебре
- Что такое несмещенный оценщик?
- Объяснение качества прилегания
- Что такое графики QQ?
Полезные блоги
- Блог Эдвина Чена — блог о математике, статистике, машинном обучении, краудсорсинге, науке о данных.
- Блог школы данных — Наука о данных для начинающих!
- ML Wave — блог по обучению машинному обучению
- Андрей Карпаты — Блог о глубоком обучении и науке о данных в целом.
- Блог Колы — блог Awesome Neural Networks
- Блог Алекса Миннаара — блог о машинном обучении и программной инженерии.
- Статистически значимый — Блог Эндрю Ландграфа по науке о данных
- Простая статистика — блог трех профессоров биостатистики.
- Блог Янира Серусси — блог о науке о данных и не только
- fastML — Машинное обучение стало проще
- Блог Тревора Стивенса — Личная страница Тревора Стивенса
- не свободная догадка | kaggle — блог Kaggle обо всем, что связано с наукой о данных.
- Количественное путешествие | outlace — изучение количественных приложений
- r4stats — анализировать мир науки о данных и помогать людям учиться использовать R
- Объяснение дисперсии — Блог Дэвида Робинсона
- AI Junkie — блог об искусственном интеллекте
Ресурсы на Quora
- Самые популярные авторы машинного обучения
- Тема Data Science на Quora
- Ответы Уильяма Чена
- Ответы Майкла Хохстера
- Ответы Рикардо Владимиро
- Рассказ со статистикой
- Часто задаваемые вопросы по науке о данных на Quora
- Часто задаваемые вопросы о машинном обучении на Quora
Описание соревнований Kaggle
- Как почти выиграть соревнования Kaggle
- Сверточные нейронные сети для обнаружения ЭЭГ
- Объяснение рекрутинга в Facebook III
- Прогнозирование CTR с помощью Online ML
Шпаргалки
Классификация
- Улучшают ли классы балансировки производительность классификатора?
- Что такое Девианс?
- Когда выбрать какой классификатор машинного обучения?
- В чем преимущества разных алгоритмов классификации?
- ROC и AUC объяснили
- Введение в ROC-анализ
- Простой справочник по терминологии матрицы путаницы
Линейная регрессия
- "Общий"
- Предположения линейной регрессии, Обмен стеками
- Всеобъемлющий ресурс по линейной регрессии
- Применение и интерпретация линейной регрессии
- Что означает постоянная дисперсия в модели линейной регрессии?
- Разница между линейной регрессией по у с х и по х с у
- Действительна ли линейная регрессия, когда зависимая переменная не имеет нормального распределения?
- Мультиколлинеарность и VIF
- Фиктивная переменная ловушка | Мультиколлинеарность
- Работа с мультиколлинеарностью с помощью VIF
- Остаточный анализ
- Интерпретация plot.lm() в R
- Как интерпретировать сюжет QQ?
- Интерпретация остатков по сравнению с подогнанным графиком
- Выбросы
- Как следует поступать с выбросами?
- Эластичная сетка
- Регуляризация и выбор переменных с помощью эластичной сети
Подписаться на МЛАИТ
Логистическая регрессия
- Вики логистической регрессии
- Геометрическая интуиция логистической регрессии
- Получение прогнозируемых категорий (выбор порога)
- Остатки в логистической регрессии
- Разница между логит- и пробит-моделями, Вики по логистической регрессии, Вики по модели пробит
- Псевдо R2 для логистической регрессии, Как считать, Другие детали
Проверка модели с использованием передискретизации
- Объяснение повторной выборки
- Разделение набора данных в R
- Внедрение валидации удержания в R, 2
- "Перекрестная проверка"
- Обучение с полным набором данных после резюме?
- Какой метод резюме лучше?
- Оценки дисперсии в k-кратном CV
- Является ли CV заменой Validation Set?
- Выбор k в k-кратном резюме
- Резюме для ансамблевого обучения
- k-кратное резюме в R
- Хорошие ресурсы
- Переобучение и перекрестная проверка
- Предотвращение переобучения данных перекрестной проверки | Эндрю Нг
- Переобучение в выборе модели и последующая ошибка выбора в оценке производительности
- CV для обнаружения и предотвращения Overfitting
- Как CV преодолевает проблему переобучения
- Самозагрузка
- Почему начальная загрузка работает?
- Хорошая анимация
- Пример начальной загрузки
- Понимание начальной загрузки для проверки и выбора модели
- Перекрестная проверка против начальной загрузки для оценки ошибки прогнозирования, Перекрестная проверка против начальной загрузки .632 для оценки эффективности классификации
Подписаться на МЛАИТ
Глубокое обучение
- Список потрясающих руководств, проектов и сообществ по глубокому обучению
- Много ресурсов для глубокого обучения
- Интересные проекты глубокого обучения и НЛП (Стэнфорд), Веб-сайт
- Основные концепции глубокого обучения
- Понимание естественного языка с помощью глубоких нейронных сетей с использованием Torch
- Стэнфордский учебник по глубокому обучению
- Часто задаваемые вопросы о глубоком обучении на Quora
- Страница глубокого обучения Google+
- Недавние AMA Reddit, связанные с глубоким обучением, Еще одна AMA
- Где научиться глубокому обучению?
- Глубокое изучение концепций nvidia
- Введение в глубокое обучение с использованием Python (GitHub), Хорошие вводные слайды
- Видео-лекции Оксфорд 2015, Летняя видео-лекция в Монреале
- Список программ для глубокого обучения
- Руководство хакера по нейронным сетям
- Объяснение Top arxiv Deep Learning Papers
- Видео Джеффа Хинтона на Youtube о глубоком обучении
- Потрясающий список для чтения по глубокому обучению
- Комплексный веб-сайт глубокого обучения, Программное обеспечение
- Учебники по углубленному изучению
- "КЛАССНО! Учебник по глубокому обучению»
- Основы глубокого обучения
- Стэнфордские учебники
- Обучение, проверка и тестирование искусственных нейронных сетей
- Учебники по искусственным нейронным сетям
- Часто задаваемые вопросы о нейронных сетях по переполнению стека
- Учебники по глубокому обучению на deeplearning.net
- Нейронный машинный перевод
- Введение в нейронный машинный перевод с использованием графических процессоров (часть 1), Часть 2, Часть 3
- Глубокая речь: точное распознавание речи с помощью GPU-ускоренного глубокого обучения
- Структуры глубокого обучения
- Факел против Теано
- dl4j против torch7 против теано
- Библиотеки глубокого обучения по языкам
- Теано
- "Веб-сайт"
- Введение в Теано
- Учебник Теано
- Учебник хорошего Теано
- Логистическая регрессия с использованием Theano для классификации цифр
- MLP с использованием Theano
- CNN с использованием Theano
- RNN с использованием Theano
- LSTM для анализа настроений в Theano
- УКР с использованием Theano
- DBN с использованием Theano
- Все коды
- Факел
- Torch ML Tutorial, Код
- Введение в Факел
- Learning Torch GitHub Repo
- Awesome-Torch (Репозиторий на GitHub)
- Машинное обучение с использованием Torch Oxford Univ, Код
- Обзор внутреннего устройства горелки
- Шпаргалка по факелу
- Понимание естественного языка с помощью глубоких нейронных сетей с использованием Torch
- Кафе
- Глубокое обучение для компьютерного зрения с Caffe и cuDNN
- TensorFlow
- "Веб-сайт"
- Изучение TensorFlow GitHub Repo
- Эталон TensorFlow на GitHub
- Сети прямой связи
- Реализация нейронной сети с нуля, Код
- Ускорение вашей нейронной сети с помощью Theano и GPU, Код
- Основы теории ИНС
- Роль смещения в нейронных сетях
- Выбор количества скрытых слоев и узлов, 2, 3
- Объяснение обратного распространения
- ИНС реализована на C++ | ИИ наркоман
- Простая реализация
- НН для начинающих
- Регрессия и классификация с нейронными сетями (слайды)
- Другое интро
- Рекуррентные и LSTM-сети
- awesome-rnn: список ресурсов (GitHub Repo)
- Рекуррентная нейронная сеть. Часть 1, Часть 2, Часть 3, Код
- Представления НЛП РНН
- Необоснованная эффективность RNN, Torch Code, Python Code
- Введение в RNN, LSTM
- Приложение РНН
- Оптимизация производительности RNN
- Простой РНН
- Автогенерация кликбейта с помощью RNN
- Последовательное обучение с использованием RNN (Слайды)
- Машинный перевод с использованием RNN (Paper)
- Генерация музыки с использованием RNN (Keras)
- Использование RNN для создания диалога на лету (Keras)
- Долгосрочная кратковременная память (LSTM)
- Понимание сетей LSTM
- LSTM объяснил
- ЛСТМ
- Внедрение LSTM с нуля, Код Python/Theano
- Код Факела, Факел
- LSTM для анализа настроений в Theano
- Глубокое обучение для визуальных вопросов и ответов | ЛСТМ | CNN, Кодекс
- «Компьютер отвечает на электронную почту | Google"
- LSTM значительно улучшает голосовой поиск Google, 2
- Понимание естественного языка с помощью глубоких нейронных сетей с использованием Torch
- Регулярные блоки закрытого типа (GRU)
- LSTM против ГРУ
- Рекурсивная нейронная сеть (не рекуррентная)
- Рекурсивная нейронная тензорная сеть (РНТС)
- word2vec, DBN, RNTN для анализа настроений
- Ограниченная машина Больцмана
- Руководство для начинающих по RBM
- Еще один хороший учебник
- Введение в RBM
- Руководство Хинтона по обучению RBM
- УКР в R
- Учебник по сетям глубокого доверия
- word2vec, DBN, RNTN для анализа настроений
- Автоэнкодеры: без присмотра (применяет BackProp после установки target = input)
- Andrew Ng Sparse Autoencoders pdf
- Глубокий учебник по автоэнкодерам
- Автоэнкодеры шумоподавления, Theano Code
- Автоэнкодеры с шумоподавлением
- Сверточные сети
- Awesome Deep Vision: список ресурсов (GitHub)
- Введение в CNN
- Понимание CNN для НЛП
- Стэнфордские заметки, Кодексы, GitHub
- Библиотека JavaScript (на основе браузера) для CNN
- Использование CNN для обнаружения ключевых точек лица
- Глубокое обучение классификации бизнес-фото в Yelp
- Интервью с Яном Лекуном | Kaggle
- Визуализация и понимание CNN
Подписаться на МЛАИТ
Обработка естественного языка
- Тщательно подобранный список ресурсов для обработки речи и естественного языка
- Понимание естественного языка с помощью глубоких нейронных сетей с использованием Torch
- Объяснение tf-idf
- Интересные проекты глубокого обучения НЛП в Стэнфорде, Веб-сайт
- НЛП с нуля | Гугл Бумага
- Обучение с полуучителем на основе графа для НЛП
- Мешок слов
- Текст классификации с мешком слов
- Тематическое моделирование
- LDA, LSA, Вероятностный LSA
- Потрясающее объяснение LDA!. Еще одно хорошее объяснение
- Шведский стол LDA — интуитивно понятное объяснение
- Разница между LSI и LDA
- Оригинальная бумага LDA
- альфа и бета в LDA
- Интуитивное объяснение распределения Дирихле
- Тематическое моделирование достаточно просто
- Онлайн LDA, Онлайн LDA со Spark
- LDA на Scala, Часть 2
- Сегментация хронологии Twitter с помощью тематического моделирования
- Тематическое моделирование подписчиков в Твиттере
- слово2век
- Гугл word2vec
- Модель Мешка Слов Вики
- Подробнее о моделировании Skip Gram
- Пропустить учебник по модели Gram, Модель CBoW
- Word Vectors Kaggle Tutorial Python, Часть 2
- Понимание слова2vec
- word2vec объяснил на deeplearning4j
- Куора word2vec
- Другие ресурсы Quora, 2, 3
- word2vec, DBN, RNTN для анализа настроений
- Кластеризация текста
- Как работает кластеризация строк
- Расстояние Левенштейна для измерения разности двух последовательностей
- Кластеризация текста с расстояниями Левенштейна
- Текстовая классификация
- Текст классификации с мешком слов
- Изучение языка с помощью НЛП и обучения с подкреплением
- Kaggle Tutorial Bag of Words and Word vectors, Часть 2, Часть 3
- Что сказал бы Шекспир (учебник по НЛП)
- Подробнее о моделировании Skip Gram
Компьютерное зрение
Машина опорных векторов
- Наиболее популярные вопросы об SVM на перекрестной проверке
- Помогите мне понять SVM!
- SVM с точки зрения неспециалиста
- Как работает SVM | Сравнения
- Учебник по SVM
- Практическое руководство по СВК, Слайды
- Вводный обзор SVM
- Сравнения
- SVM › ANN, ANN › SVM, Другое сравнение
- Деревья › SVM
- Ядерная логистическая регрессия против SVM
- Логистическая регрессия против SVM, 2, 3
- Алгоритмы оптимизации в машинах опорных векторов
- Значение переменной из SVM
- Программное обеспечение
- ЛИБСВМ
- Введение в SVM в R
- ядра
- Что такое ядра в ML и SVM?
- Интуиция за гауссовым ядром в SVM?
- Вероятность после SVM
- Вероятностные выходы Платта для SVM
- Вики по калибровке Platt
- Зачем использовать Platts Scaling
- Классификация классификаторов с использованием шкалы Платта
Обучение с подкреплением
Деревья решений
- Страница Википедии — много полезной информации
- Часто задаваемые вопросы о деревьях решений
- Краткая экскурсия по деревьям и лесам
- Деревовидные модели в R
- Как работают деревья решений?
- Слабая сторона деревьев решений
- Тщательное объяснение и разные алгоритмы
- Что такое энтропия и прирост информации в контексте построения деревьев решений?
- Слайды, связанные с деревьями решений
- Как алгоритмы обучения дерева решений справляются с пропущенными значениями?
- Использование суррогатов для улучшения наборов данных с отсутствующими значениями
- Хорошая статья
- Являются ли деревья решений почти всегда бинарными деревьями?
- Обрезка деревьев решений, Прививка деревьев решений
- Что такое девиантность в контексте деревьев решений?
- Сравнение различных алгоритмов
- ТЕЛЕГА против CTREE
- Сравнение сложности или производительности
- ЧАЙД против ТЕЛЕГИ, ТЕЛЕГА против ЧАИДА
- Хорошая статья о сравнении
- КОРЗИНА
- Рекурсивное разбиение Википедии
- Объяснение КОРЗИНЫ
- Как измерить/ранжировать «переменную важность при использовании CART?»
- Обрезка дерева в R
- Использует ли rpart многомерное разбиение по умолчанию?
- Часто задаваемые вопросы о рекурсивном разбиении
- CTREE
- праздничный пакет в R
- Показать объем в каждом узле с помощью ctree в R
- Как извлечь древовидную структуру из функции ctree?
- ЧАЙД
- Статья Википедии о ЧАИД
- Основное введение в CHAID
- Хороший учебник по CHAID
- МАРС
- Статья в Википедии о МАРСе
- Вероятностные деревья решений
- Байесовское обучение в вероятностных деревьях решений
- Исследование вероятностных деревьев
Случайный лес/бэггинг
- Удивительный случайный лес (GitHub)**
- Как на практике настроить ВЧ-параметры?
- Меры переменной важности в случайных лесах
- Сравните R-квадрат из двух разных моделей Random Forest
- Объяснение оценки OOB | РФ против LDA
- Оценка случайных лесов для анализа выживания с использованием кривой ошибки прогноза
- Почему Random Forest не обрабатывает пропущенные значения в предикторах?
- Как строить случайные леса в R с пропущенными (NA) значениями?
- Часто задаваемые вопросы о Random Forest, Другие часто задаваемые вопросы
- Получение знаний из случайного леса
- Некоторые вопросы по реализации R, 2, 3
Повышение
- Повышение качества прогнозов
- Раскрутка страницы Википедии
- Введение в усиленные деревья | Тяньци Чен
- Машина повышения градиента
- Усиление градиента вики
- Рекомендации по параметрам GBM в R, Стратегия установки параметров
- Значение глубины взаимодействия, 2
- Роль параметра n.minobsinnode ГБМ в R
- ГБМ в Р
- Часто задаваемые вопросы о ГБМ
- GBM против xgboost
- xgboost
- xgboost настройка kaggle
- xgboost против gbm
- опрос xgboost
- АдаБуст
- AdaBoost Wiki, Код Python
- Поддержка разреженного ввода AdaBoost
- adaBag R пакет
- "Руководство"
Ансамбли
- Статья в Википедии о ансамблевом обучении
- Руководство по сборке Kaggle
- Сила простых ансамблей
- Обучение ансамблю
- Обучающая работа ансамбля
- Сборка моделей в R, Сборка регрессионных моделей в R, Введение в ансамбли в R
- Сборка моделей с каре
- Бэггинг против бустинга против стекинга
- Хорошие ресурсы | Kaggle: прогноз свойств почвы в Африке
- Буст против бэггинга
- Ресурсы для обучения реализации ансамблевых методов
- Как объединяются классификации в ансамблевом классификаторе?
Подписаться на МЛАИТ
Модели стекирования
- Стекирование, смешивание и обобщение с накоплением
- Стековое обобщение (Stacking)
- Стековое обобщение: когда это работает?
- Сложенная статья об обобщении
Измерение Вапника–Червоненкиса
- Статья в Википедии о VC Dimension
- Интуитивное объяснение измерения ВК
- Видео, объясняющее измерение венчурного капитала
- Введение в VC Dimension
- Часто задаваемые вопросы о VC Dimension
- Увеличивают ли ансамблевые методики VC-размерность?
Байесовское машинное обучение
- Байесовские методы для хакеров (с использованием pyMC)
- Должно ли машинное обучение быть байесовским?
- Учебник по байесовской оптимизации для машинного обучения
- Байесовское мышление и глубокое обучение, Слайды
- Байесовская статистика — это просто
- Фильтры Калмана и Байеса в Python
- Страница цепи Маркова в Википедии
Полуконтролируемое обучение
- Статья в Википедии о полуконтролируемом обучении
- Учебник по полуконтролируемому обучению
- Обучение с полуучителем на основе графа для НЛП
- Таксономия
- Видеоурок Weka
- Обучение без учителя, с учителем и полуучителем
- Научные статьи 1, 2, 3
Оптимизация
- Оптимизация портфеля средней дисперсии с помощью R и квадратичного программирования
- Алгоритмы разреженной оптимизации и машинного обучения
- Алгоритмы оптимизации в машинном обучении, Видеолекция
- Алгоритмы оптимизации анализа данных
- Видео-лекции по оптимизации
- Алгоритмы оптимизации в машинах опорных векторов
- Взаимодействие исследований оптимизации и машинного обучения