Публикации по теме 'neural-networks'
Нежное руководство по большим языковым моделям
Отделение фактов от шумихи
Введение
Я стремлюсь предоставить простое для понимания объяснение того, как работают системы искусственного интеллекта, такие как ChatGPT, включая GPT-3, GPT-4, Bing Chat и Bard. ChatGPT — это чат-бот, использующий модель большого языка, которую я объясню простыми словами в этой статье. Мы рассмотрим основные концепции этих технологий, используя метафоры, чтобы проиллюстрировать их.
Вам не нужно никаких технических или математических знаний, чтобы..
Обратное распространение простым способом, не углубляясь в сложные
Обратное распространение — это метод, используемый при обучении искусственных нейронных сетей, который помогает им учиться на данных и улучшать свою производительность с течением времени. Это похоже на механизм обратной связи, который позволяет сети корректировать свои веса и смещения, чтобы делать более точные прогнозы.
Чтобы понять обратное распространение, давайте рассмотрим упрощенную нейронную сеть с тремя слоями: входной слой, скрытый слой и выходной слой. Каждый слой состоит из..
Методы регуляризации
При обучении нейронных сетей важна не столько производительность на обучающем наборе, сколько то, что сеть способна применять знания, полученные во время обучения, к новым данным. Этот навык известен как обобщение, и существуют методы улучшения этой способности. В целом эти техники называются регуляризацией и именно о них мы и поговорим в этом посте.
Что такое регуляризация? Какова его цель?
Регуляризация — это метод ограничения эффектов переобучения.
Переобучение — это..
Простейшая нейронная сеть с использованием TensorFlow | Глубокое обучение
В традиционном программировании мы предоставляем данные, устанавливаем правила и рисуем вывод. Сначала к данным применяются правила, а затем мы делаем вывод или вывод из него.
Например, здесь мы будем использовать условие if else для скорости ходьбы, бега и езды на велосипеде.
В машинном обучении (также называемом прогнозной аналитикой) мы даем больше данных и выясняем сходство из набора данных и делаем правило, что если вещи такие, и это для ходьбы, то мы получаем шаблон.
В..
От предсказания к эмпатии: зачем ИИ нужна теория разума
Заявление Михала Косински о том, что «способность приписывать психическое состояние других значительно улучшит способность ИИ взаимодействовать и общаться с людьми (и друг с другом) и позволит ему развивать другие способности, основанные на теории разума, такие как эмпатия, моральное суждение или самосознание» широко распространено в области искусственного интеллекта и когнитивной науки.
Теория разума (ToM) — это способность понимать и приписывать психические состояния себе и другим, такие..
Воскресный брифинг D4S №142
Воскресный брифинг D4S №142
Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.
13 февраля 2022 г.
Дорогие друзья, Добро пожаловать в воскресный брифинг Superb Owl.
На этой неделе мы рады сообщить, что только что опубликовали статью Модели эпидемий: роль корреляции степеней в подстеке Графики для науки . Мы также недавно опубликовали в Medium резюме 10 лучших книг, которые мы прочитали..
Зигзаг // Двухпотоковая рекуррентная нейронная сеть, двойная нейронная сеть с интерактивным кодом.
У меня никогда не было брата-близнеца, но если бы он был у меня, это было бы здорово. Мы думали бы иначе, но очень похожи друг на друга. И это заставило меня задуматься, можно ли применить эту концепцию и к нейронным сетям? Я хотел узнать. Как всегда, ниже приведен список различных архитектур, которые я хочу реализовать для этого поста.
Случай a: рекуррентная нейронная сеть с двумя потоками Случай b: рекуррентная нейронная сеть с двойным потоком и зигзагом Случай c: рекуррентная..