Публикации по теме 'nlp'


Малоресурсный язык: что это значит?
Чтобы создавать решения для обработки естественного языка (NLP) для любого языка, самое важное, что вам нужно, — это данные на этом языке. В мире насчитывается более 7000 языков, на которых говорят люди, но из этих 7000 языков только около 20 имеют текстовые корпуса из сотен миллионов слов. Английский на сегодняшний день является языком с наибольшим объемом данных, за ним следуют китайский и испанский. Другие языки с большими наборами данных включают западноевропейские языки, а также..

Демистификация обработки естественного языка: как это работает на примере реального времени!!
Статья Ark Innovation от Рахула. В сегодняшнюю цифровую эпоху способность обрабатывать и понимать человеческий язык становится все более важной. Обработка естественного языка (NLP) — это подраздел искусственного интеллекта (ИИ), который фокусируется на том, чтобы позволить компьютерам понимать, интерпретировать и генерировать человеческий язык. НЛП имеет широкий спектр приложений, от чат-ботов и виртуальных помощников до анализа настроений и машинного перевода. В этом сообщении блога мы..

Infrrd упоминается в двух недавних отчетах Gartner Hype Cycle
400 компаний в США, ежегодно обрабатывающих более миллиона счетов, отмечают резкое увеличение использования IDP для работы с кредиторской задолженностьюКомпания признана образцовым поставщиком интеллектуальной обработки документов САН-ХОСЕ, Калифорния… 23 августа 2022 г. … Infrrd , ведущий поставщик решений для интеллектуальной обработки документов (IDP), объявила сегодня, что она была названа поставщиком образцов для IDP в двух недавних отчетах Gartner Hype Cycle. В обоих отчетах..

Интеграция Fastai с BERT
ПРОЛОГ Нет сомнений в том, что трансферное обучение в области глубокого обучения оказалось чрезвычайно полезным и произвело революцию в этой области. Однако, в отличие от задач, связанных с распознаванием и обработкой изображений, для задач обработки естественного языка (NLP), которые в основном связаны с текстами и документами, до недавнего времени не было достигнуто большого успеха. В этой статье я буду использовать две новейшие современные техники обработки естественного языка..

Тихий сдвиг в экосистеме НЛП
Он уже в движении… суть Статья, опубликованная несколько дней назад (15 июня 2022 г.) , предлагает ключевое представление о впечатляющих возможностях решения задач, которые дает недавний поток языковых моделей с более чем миллиардом параметров. Большие языковые модели проявляют способность решать конкретные задачи при соблюдении двух условий — размер параметра модели превышает 100 миллиардов и объем обучения превышает 10²³ FLOPS. Ниже этих порогов способность решать эти..

Как бы Шекспир читал? (Практическая реализация LSTM для синтеза текста)
Впервые это было опубликовано в моем блоге в августе 2017 года. Я учился (и все еще учусь), поэтому, пожалуйста, простите - или, еще лучше, укажите - ошибки, которые я мог допустить. Глубокий Рапспир Синтез Рэп-склоняемого Шекспира с использованием рекуррентной нейронной сети LSTM, вдохновленной Карпати Введение - Подготовка к тренировке - изменение кода - И вот! - Заключительные замечания «MOTH. Но проверьте это своей душой (может больше) на этом мальчике ». - краткий..

Использование Twitter API для анализа настроения твитов
Каждый день генерируется много данных в разных формах, и одна из форм - текст; один хороший источник этих текстовых данных - твиты, где люди активно делятся своими мыслями. Наша цель в этой статье - использовать Twitter API для извлечения твитов и анализа их настроений. Необходимые библиотеки и модули: import matplotlib.pyplot as plt %matplotlib inline import re import pandas as pd import tweepy from tweepy import OAuthHandler from textblob import..