Публикации по теме 'data-analysis'
Заменит ли ChatGPT программистов?
Поскольку искусственный интеллект и машинное обучение продолжают развиваться, существует общее опасение, что эти технологии в конечном итоге заменят человеческие рабочие места, включая программирование. Хотя большие языковые модели, такие как ChatGPT, действительно могут генерировать человекоподобный текст и могут быть обучены выполнению определенных задач, маловероятно, что они полностью заменят программистов.
Программирование включает в себя сочетание логического мышления, решения..
Бесплатные данные 2023: огромный список бесплатных наборов данных
Ваш каталог бесплатных наборов данных и источников для проектов по науке о данных в 2023 году
Официально декабрь, а это значит, что 2022 год уже подходит к концу. Скорее всего, если вы начинаете большой проект сейчас, вы можете не закончить его до 2023 года. Поэтому с прицелом на будущее я решил собрать полный список бесплатных наборов данных.
Являетесь ли вы любителем науки о данных, как я, студентом или профессионалом, вам нужны данные. Я прошерстил глубины Google, чтобы вам не..
Основные вопросы интервью в Data Science
Аналитика данных
Как вы справляетесь с отсутствующими данными? → 1. Удаление отсутствующих данных, но это приводит к потере данных и информации, если их много 2. Замена отсутствующих данных средним/медианным значением или модой. Режим в случае категориального набора данных. 3. Добавление двоичного столбца для указания отсутствующих данных или данных, не основанных на выполнении анализа с этими записями или без них 4. Обновление подходящего значения для конкретного домена Как вы..
Аккуратная предварительная обработка данных с помощью Pipeline и ColumnTransformer
❓ Почему трубопроводный и колонный трансформатор?
При работе над проектом машинного обучения наиболее утомительным этапом часто является этап очистки и предварительной обработки данных. Прежде всего, когда вы работаете в Jupyter Notebook, выполнение кода во многих ячейках может сбивать с толку.
Перед обучением модели данные должны быть помещены в обучающий набор и тестовый набор. Каждый набор данных пройдет этап очистки и предварительной обработки данных перед входом в модель..
Информация о Формуле 1 на основе AWS: будущее Гран-при
Как автомобильный энтузиаст, мне всегда нравилось знать об автомобилях, водить их и играть в гоночные игры. Либо игра в игру F1 в аркаде, либо наблюдение за машинами F1, проносящимися по гоночной трассе на скорости до 370 км / ч (230 миль / ч), вызывает определенное волнение. Этот азарт скорости и стратегии - причина того, что у F1 более полумиллиарда поклонников по всему миру.
В этой статье я хотел бы представить, как Формула 1 использует машинное обучение для автоматизации, сбора,..
Вложенная перекрестная проверка: когда (простой) перекрестной проверки недостаточно
Несколько научных дисциплин в последние годы потрясен кризисом воспроизводимости [1]. Не так давно исследователи Bayer обнаружили, что им удалось воспроизвести только 25% важных фармацевтических статей, которые они исследовали [2], и в отчете Массачусетского технологического института о статьях по машинному обучению были получены аналогичные результаты. Некоторые области начали выходить из кризиса, но другие области, такие как психология, возможно, еще не достигли дна [3] [4].
Можно..
Руководство для начинающих по прогнозированию временных рядов
Прогнозирование временных рядов — это использование модели для прогнозирования будущих значений на основе ранее наблюдаемых значений. Это важнейший компонент многих деловых и экономических процессов принятия решений, поскольку он позволяет организациям делать обоснованные прогнозы будущих событий. В этом руководстве мы предоставим обзор прогнозирования временных рядов, в том числе его важность, различные типы моделей и практические советы для читателей, которые плохо знакомы с этой темой...