Статьи по теме neural-networks

Публикации по теме 'neural-networks'

Нежное руководство по большим языковым моделям

Отделение фактов от шумихи Введение Я стремлюсь предоставить простое для понимания объяснение того, как работают системы искусственного интеллекта, такие как ChatGPT, включая GPT-3, GPT-4, Bing Chat и Bard. ChatGPT — это чат-бот, использующий модель большого языка, которую я объясню простыми словами в этой статье. Мы рассмотрим основные концепции этих технологий, используя метафоры, чтобы проиллюстрировать их. Вам не нужно никаких технических или математических знаний, чтобы..

Обратное распространение простым способом, не углубляясь в сложные

Обратное распространение — это метод, используемый при обучении искусственных нейронных сетей, который помогает им учиться на данных и улучшать свою производительность с течением времени. Это похоже на механизм обратной связи, который позволяет сети корректировать свои веса и смещения, чтобы делать более точные прогнозы. Чтобы понять обратное распространение, давайте рассмотрим упрощенную нейронную сеть с тремя слоями: входной слой, скрытый слой и выходной слой. Каждый слой состоит из..

Методы регуляризации

При обучении нейронных сетей важна не столько производительность на обучающем наборе, сколько то, что сеть способна применять знания, полученные во время обучения, к новым данным. Этот навык известен как обобщение, и существуют методы улучшения этой способности. В целом эти техники называются регуляризацией и именно о них мы и поговорим в этом посте. Что такое регуляризация? Какова его цель? Регуляризация — это метод ограничения эффектов переобучения. Переобучение — это..

Простейшая нейронная сеть с использованием TensorFlow | Глубокое обучение

В традиционном программировании мы предоставляем данные, устанавливаем правила и рисуем вывод. Сначала к данным применяются правила, а затем мы делаем вывод или вывод из него. Например, здесь мы будем использовать условие if else для скорости ходьбы, бега и езды на велосипеде. В машинном обучении (также называемом прогнозной аналитикой) мы даем больше данных и выясняем сходство из набора данных и делаем правило, что если вещи такие, и это для ходьбы, то мы получаем шаблон. В..

От предсказания к эмпатии: зачем ИИ нужна теория разума

Заявление Михала Косински о том, что «способность приписывать психическое состояние других значительно улучшит способность ИИ взаимодействовать и общаться с людьми (и друг с другом) и позволит ему развивать другие способности, основанные на теории разума, такие как эмпатия, моральное суждение или самосознание» широко распространено в области искусственного интеллекта и когнитивной науки. Теория разума (ToM) — это способность понимать и приписывать психические состояния себе и другим, такие..

Воскресный брифинг D4S №142

Воскресный брифинг D4S №142 Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта. 13 февраля 2022 г. Дорогие друзья, Добро пожаловать в воскресный брифинг Superb Owl. На этой неделе мы рады сообщить, что только что опубликовали статью Модели эпидемий: роль корреляции степеней в подстеке Графики для науки . Мы также недавно опубликовали в Medium резюме 10 лучших книг, которые мы прочитали..

Зигзаг // Двухпотоковая рекуррентная нейронная сеть, двойная нейронная сеть с интерактивным кодом.

У меня никогда не было брата-близнеца, но если бы он был у меня, это было бы здорово. Мы думали бы иначе, но очень похожи друг на друга. И это заставило меня задуматься, можно ли применить эту концепцию и к нейронным сетям? Я хотел узнать. Как всегда, ниже приведен список различных архитектур, которые я хочу реализовать для этого поста. Случай a: рекуррентная нейронная сеть с двумя потоками Случай b: рекуррентная нейронная сеть с двойным потоком и зигзагом Случай c: рекуррентная..