Статьи по теме deep-learning

Публикации по теме 'deep-learning'

Что такое сети глубокого убеждения?

Сети глубокого убеждения — это тип алгоритма глубокого обучения. Их также называют машинами глубокого Больцмана . Сеть глубокого убеждения — это тип алгоритма глубокого обучения, который используется для создания генеративных моделей. Сеть состоит из нескольких слоев, каждый из которых содержит узлы с непрерывными весами. Входные признаки передаются в первый слой, а выходные данные последнего слоя представляют собой распределение вероятностей по классам. Сети глубокого..

Проинструктируйте о тонкой настройке Falcon 7B с помощью LoRA

Введение В последние годы обработка естественного языка (NLP) значительно продвинулась вперед благодаря мощным моделям больших языков, таким как Falcon 7B. Falcon 7B — это современный LLM, основанный на архитектуре Transformer ( https://huggingface.co/blog/falcon ). В то время как Falcon 7B предлагает впечатляющую готовую производительность, тонкая настройка инструкций позволяет вам создать свой собственный LLM с учетом контекста и знаний о ваших данных. В этой статье мы..

Приложения нейронных сетей с информацией о физике (PINN), часть 2 (машинное обучение)

Eco-PiNN: нейронная сеть, основанная на физике, для оценки экологических потерь (arXiv) Автор: Ян Ли , Минчжоу Ян , Мэттью Игон , Маджид Фархадлу , Йикун Се , Уильям Ф. Нортроп , Шаши Шекхар Аннотация : задача оценки экологических потерь количественно определяет ожидаемые экологические издержки (например, потребление энергии, выбросы выхлопных газов) для транспортного средства, движущегося по пути. Эта проблема важна для социальных приложений, таких как..

Работа с пространственно-временным мышлением, часть 4 (искусственный интеллект)

TGIF-QA: к пространственно-временным рассуждениям в визуальных ответах на вопросы (arXiv) Автор: Юнсок Чан , Йельская песня , Ёнджэ Ю , Ёнджин Ким , Гунхи Ким . Аннотация: Зрение и понимание языка стали предметом интенсивного изучения в области искусственного интеллекта. Среди многих задач в этом направлении исследований визуальные ответы на вопросы (VQA) были одними из самых успешных, где цель состоит в том, чтобы изучить модель, которая понимает визуальный контент на уровне..

Как выбрать правильную функцию активации для вашей нейронной сети

Линейный, Сигмовидный, ReLU ОБЪЯСНЕН!!! В моем проекте распознавания цифр моя нейронная сеть изо всех сил пыталась работать хорошо. Однако я обнаружил функции активации, которые позволяют нейронным сетям изучать нелинейные отношения. Но я не знал, какую функцию активации использовать, поскольку доступно много вариантов. Поэтому в этом блоге я объяснил основные функции активации и их использование. Зачем нужны функции активации? Предположим, мы хотим предсказать, станет ли..

Работа с моделями преобразования текста в изображение, часть 2 (машинное обучение)

Как обнаружить несанкционированное использование данных в моделях распространения текста в изображение (arXiv) Автор: Чжэньтин Ван , Чэнь Чен , Ючэнь Лю , Линцзюань Лю , Димитрис Метаксас , Шицинг Ма . Аннотация: последние модели диффузии текста в изображение продемонстрировали удивительную производительность при создании высококачественных изображений. Однако возникли опасения по поводу несанкционированного использования данных в процессе обучения. Одним из примеров является..

Мы знаем, что вам нужно, но не видим ваших данных

Как построить рекомендательную систему с цензурированными данными В отличие от распространенного мнения о том, что система рекомендаций, которая теперь является стандартной частью онлайн-сервисов, требует использования всех исторических взаимодействий между пользователями и элементами для обеспечения точности обслуживания. Здесь я представляю один подход, позволяющий точно рекомендовать пользователям хорошие элементы, в то же время на стороне пользователя подвергая цензуре историческое..