Статьи по теме data-science

Публикации по теме 'data-science'

Скептики ChatGPT выбрали не тот лагерь: GPT научился логике. Период.

Вот выдержки из доклада Microsoft в Беркли без камер в апреле 2023 года о возможностях GPT. И как это подтверждает и расширяет наши коллективные представления о появлении интеллекта в LLM. Начнем с заметок Хизер Уэст ( Execs on Deck ), опубликованных на LI, из этого выступления на GPT Microsoft Себастьяна Бубека в Университете Беркли :

Пациент пережил предсказание после пяти лет операции (рак) машинное обучение

Набор данных Хабермана: https://www.kaggle.com/datasets/gilsousa/habermans-survival-data-set Набор данных Хабермана — это набор медицинских данных, который содержит данные о пациентах с раком молочной железы, перенесших операцию в больнице Биллингса Чикагского университета в период с 1958 по 1970 год. Набор данных обычно используется в машинном обучении и статистическом анализе для прогнозирования выживания пациентов, перенесших операцию. хирургия рака молочной железы. Набор данных..

Как манипулировать и визуализировать данные для сравнительного анализа - Crunch time в НБА

Использование Python с Pandas и Plotly для нарезки, группировки и визуализации данных для получения новых идей (код и данные в моем репозитории GitLab ). В этой статье я демонстрирую, как обрабатывать и визуализировать данные для сравнительного анализа. Я начинаю анализ с одного набора данных, который будет проанализирован, чтобы найти подходящее разделение и найти лучшее подмножество для сравнения с оставшимися данными. Фактически, в этой статье рассматриваются данные НБА за..

Этика в науке о данных — День 38

50-дневный план обучения для начинающих специалистов по данным | Автор Круио Добро пожаловать на 38-й день вашего путешествия по науке о данных! На протяжении этого увлекательного путешествия мы рассмотрели широкий спектр тем: от фундаментальной статистики до передовых методов машинного обучения, таких специализированных областей, как обработка естественного языка, анализ временных рядов, рекомендательные системы и многое другое. Сегодня мы углубимся в важнейший аспект науки о..

Демократизация наборов данных — Arithmetica.io

Машинное обучение в реальном мире отличается от соревнований по науке о данных, таких как Kaggle , drivendata и т. д. В то время как соревнования по науке о данных оптимизируют одну метрику, такую как AUC или потери журнала или RMSE и т. д., модели реального мира требуют более тщательного сравнения между моделями на разнообразие метрик. Чтобы практиковать настоящую науку о данных, нужно понимать и сравнивать различные метрики из отправки. Платформа Arithmetica предоставляет..

Как работает Projected Gradient Descent в конвейерах машинного обучения, часть 1

Ускоренный распределенный проецируемый градиентный спуск для выпуклой оптимизации с кликовыми связанными ограничениями (arXiv) Автор: Юто Ватанабэ , Казунори Сакурама . Аннотация: В этой статье рассматривается задача распределенной выпуклой оптимизации с классом связанных ограничений, которые возникают в многоагентной системе, состоящей из нескольких сообществ, моделируемых кликами. Во-первых, мы предлагаем полностью распределенный алгоритм на основе градиента с новым оператором,..

Уроки создания ИИ для предотвращения кибератак

19 марта 2016 года Джон Подеста был обманут, чтобы раскрыть свои учетные данные Gmail поддерживаемой Россией организации, которая затем распространила электронные письма, касающиеся кампании Клинтона, эффективно повлияв на выборы 2016 года. Атаки социальной инженерии, подобные этой (и гораздо более изощренные), находятся на подъеме и становятся все более совершенными с каждым днем. Они опираются на доверие, которое мы оказываем нашим бизнес-инструментам и социальным сетям, особенно..