Статьи по теме data-science

Публикации по теме 'data-science'

Прогнозирование времени попадания: другой способ вероятностного прогнозирования временных рядов

Сколько времени требуется для достижения определенного значения? Возможность делать точные прогнозы является фундаментальной для любого приложения для прогнозирования временных рядов. Следуя этой цели, специалисты по данным привыкли выбирать лучшие модели, которые сводят к минимуму ошибки с точки зрения точечного прогноза . Это правильно, но не всегда может быть лучшим эффективным подходом. Специалистам по данным следует также рассмотреть возможность разработки моделей..

Хаки, чтобы сделать вашу жизнь программиста немного проще

Хороший программист — это хорошо смазанная машина. Вы должны иметь возможность создавать код в быстром темпе, а также должны быть уверены, что он максимально эффективен и безошибочен. Это означает использование ярлыков, регулярные перерывы и даже контроль версий, чтобы вы всегда могли вернуться назад, если что-то пойдет не так.

Настоящий единорог: данные для тестирования машинного обучения

Давайте будем честными здесь; вы были на той встрече, где все кивали головами в знак согласия с тем, что хороший, упорядоченный рабочий процесс разработки → постановка → производственный процесс будет своевременно обнаруживать проблемы, черт возьми, это даже звучит как функциональное программирование! Но затем неизбежно последующее совещание о том, как # $ & #! ( нулевой указатель мог остановить производство, когда та самая сборка прошла тесты. По моему опыту, это почти всегда..

Как разделить данные тренировки и тестирования

Понятия, объясненные для новичков! Машинное обучение - новая горячая область науки о данных. Для поиска решений многих проблем можно использовать всевозможные алгоритмы машинного обучения, начиная от анализа настроений и прогнозирования цен на акции и заканчивая классификацией болезней с использованием изображений мозга. Данные, которые передаются в алгоритм, важны для формирования точности результата. В машинном обучении крайне важно иметь данные для обучения и тестирования, которые..

50 основных концепций обработки естественного языка для лучшего машинного обучения (часть 1)

Обработка естественного языка или НЛП — это область компьютерных наук, целью которой является устранение разрыва во взаимодействии между компьютерами и людьми на естественном языке, чтобы понять контекст языка. Давайте изучим основные концепции, чтобы начать работу с НЛП! 1. Текстовый корпус Это относится к текстовым данным, используемым для построения модели машинного обучения. Ознакомьтесь с Tiny Shakespeare , текстовым корпусом, содержащим 40 000 строк Шекспира из различных..

Как работает байесовская перспектива, часть 1 (машинное обучение)

Выборка конечного населения: беззастенчивая байесовская точка зрения (arXiv) Автор: Судипто Банерджи Аннотация: В этой статье делается попытка предложить некоторые перспективы байесовского вывода для конечных величин совокупности, когда предполагается, что единицы совокупности демонстрируют сложные зависимости. Начиная с обзора байесовских иерархических моделей, в том числе тех, которые дают основанные на планах оценки Хорвица-Томпсона, статья переходит к введению зависимости в..

Методы прогнозирования временных рядов

Полная теоретическая интуиция о временных рядах и различных связанных с ними терминологиях уже опубликована в предыдущем блоге . Этот блог полностью посвящен различным моделям/методам прогнозирования временных рядов. Ниже приведены методы, которые рассматриваются в этом блоге: Прогнозирование временных рядов с помощью методов сглаживания Экспоненциальное сглаживание Метод Холта-Уинтерса Одномерное прогнозирование временных рядов Авторегрессия (AR) Скользящая..