Публикации по теме 'deep-learning'
Что такое сети глубокого убеждения?
Сети глубокого убеждения — это тип алгоритма глубокого обучения. Их также называют машинами глубокого Больцмана .
Сеть глубокого убеждения — это тип алгоритма глубокого обучения, который используется для создания генеративных моделей. Сеть состоит из нескольких слоев, каждый из которых содержит узлы с непрерывными весами. Входные признаки передаются в первый слой, а выходные данные последнего слоя представляют собой распределение вероятностей по классам.
Сети глубокого..
Проинструктируйте о тонкой настройке Falcon 7B с помощью LoRA
Введение
В последние годы обработка естественного языка (NLP) значительно продвинулась вперед благодаря мощным моделям больших языков, таким как Falcon 7B.
Falcon 7B — это современный LLM, основанный на архитектуре Transformer ( https://huggingface.co/blog/falcon ). В то время как Falcon 7B предлагает впечатляющую готовую производительность, тонкая настройка инструкций позволяет вам создать свой собственный LLM с учетом контекста и знаний о ваших данных.
В этой статье мы..
Приложения нейронных сетей с информацией о физике (PINN), часть 2 (машинное обучение)
Eco-PiNN: нейронная сеть, основанная на физике, для оценки экологических потерь (arXiv)
Автор: Ян Ли , Минчжоу Ян , Мэттью Игон , Маджид Фархадлу , Йикун Се , Уильям Ф. Нортроп , Шаши Шекхар
Аннотация : задача оценки экологических потерь количественно определяет ожидаемые экологические издержки (например, потребление энергии, выбросы выхлопных газов) для транспортного средства, движущегося по пути. Эта проблема важна для социальных приложений, таких как..
Работа с пространственно-временным мышлением, часть 4 (искусственный интеллект)
TGIF-QA: к пространственно-временным рассуждениям в визуальных ответах на вопросы (arXiv)
Автор: Юнсок Чан , Йельская песня , Ёнджэ Ю , Ёнджин Ким , Гунхи Ким .
Аннотация: Зрение и понимание языка стали предметом интенсивного изучения в области искусственного интеллекта. Среди многих задач в этом направлении исследований визуальные ответы на вопросы (VQA) были одними из самых успешных, где цель состоит в том, чтобы изучить модель, которая понимает визуальный контент на уровне..
Как выбрать правильную функцию активации для вашей нейронной сети
Линейный, Сигмовидный, ReLU ОБЪЯСНЕН!!!
В моем проекте распознавания цифр моя нейронная сеть изо всех сил пыталась работать хорошо. Однако я обнаружил функции активации, которые позволяют нейронным сетям изучать нелинейные отношения.
Но я не знал, какую функцию активации использовать, поскольку доступно много вариантов. Поэтому в этом блоге я объяснил основные функции активации и их использование.
Зачем нужны функции активации?
Предположим, мы хотим предсказать, станет ли..
Работа с моделями преобразования текста в изображение, часть 2 (машинное обучение)
Как обнаружить несанкционированное использование данных в моделях распространения текста в изображение (arXiv)
Автор: Чжэньтин Ван , Чэнь Чен , Ючэнь Лю , Линцзюань Лю , Димитрис Метаксас , Шицинг Ма .
Аннотация: последние модели диффузии текста в изображение продемонстрировали удивительную производительность при создании высококачественных изображений. Однако возникли опасения по поводу несанкционированного использования данных в процессе обучения. Одним из примеров является..
Мы знаем, что вам нужно, но не видим ваших данных
Как построить рекомендательную систему с цензурированными данными
В отличие от распространенного мнения о том, что система рекомендаций, которая теперь является стандартной частью онлайн-сервисов, требует использования всех исторических взаимодействий между пользователями и элементами для обеспечения точности обслуживания. Здесь я представляю один подход, позволяющий точно рекомендовать пользователям хорошие элементы, в то же время на стороне пользователя подвергая цензуре историческое..