Публикации по теме 'nlp'


Понимание семантических интерпретаций BERT
Понимание семантических интерпретаций BERT Вступление В States Title мы используем обработку естественного языка (NLP) как часть нашей миссии по обеспечению более быстрого и беспрепятственного закрытия ипотечных кредитов в США. NLP - это использование математики, позволяющее компьютерам изучать и понимать человеческий язык. Большинство людей видели это в действии, когда их телефон или почтовый клиент предлагает ввести следующее слово или фразу. Наш набор инструментов NLP включает в..

ЧТО ТАКОЕ ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА? ВВЕДЕНИЕ В НЛП
Обработка естественного языка (NLP) предназначена для того, чтобы заставить компьютеры учить, обрабатывать и манипулировать естественными языками. Что такое обработка естественного языка (NLP)? NLP — это часть машинного обучения, которая занимается пониманием, анализом и созданием языков, которые люди используют естественным образом или общаются для взаимодействия с компьютерами вместо машинного языка. Приложения НЛП Машинный перевод — Google переводчик и т. д. Генерация языка..

Анализатор настроений с BERT (сборка, настройка, развертывание)
Краткое описание того, как я разработал анализатор настроений. Он охватывает предварительную обработку текста, построение модели, настройку, API, создание внешнего интерфейса и контейнеризацию. Набор данных Я использовал набор данных, опубликованный Stanford NLP Group . Я объединил два файла, а именно dictionary.txt , содержащий 239 232 фрагмента текста, и sentiment_labels.txt , содержащий оценки тональности, присвоенные различным фрагментам текста. Предварительная обработка..

Разбор Common Crawl в 4 простых скриптах на python
Разбор Common Crawl в 4-х простых скриптах на python (а не в 2-х) После запуска мини- проекта CC в нашем последнем посте мы столкнулись с несколькими проблемами, все из которых мы более или менее решили (или вообще избежали). В конце концов, полный пайплайн выглядит так (см. подробные пояснения ниже): python3 parse_cc_index.py python3 save_cc_indexes.py python3 prepare_wet_indexes.py python3 process_wet_files.py Новые задачи: Объем данных оказался в ~10–20 раз больше..

Создание простого и быстрого чат-бота за 10 минут
В реальном мире время отклика для чат-бота имеет большое значение. Будь то туристическая отрасль, банки или врачи, если вы действительно хотите помочь своим клиентам, время отклика должно быть меньше и аналогично разговору с представителем службы поддержки клиентов. Помимо времени, также важно понимать основной мотив чат-бота, каждая отрасль не может использовать одного и того же чат-бота, поскольку у них разные цели и разные наборы корпусов для ответов. Хотя трансформаторы хороши..

Трансформеры I
Тема: Внимание - это все, что вам нужно (I) Я не мог перестать улыбаться в течение пяти минут после просмотра этого твита: JK. Давайте перейдем к делу. Ментальная карта Это первый раз, когда я представляю Mind Mapping в этом блоге. Ментальные карты - это инструмент, который я использую в течение многих лет, даже не зная, что использую его. Этот инструмент помогает мне рисовать мыслительный процесс, когда я читаю академическую исследовательскую работу. Как правило, перед..

Анализ настроений на основе глубокого обучения: автоматизированный способ узнать чувства ваших клиентов
Анализ настроений на основе глубокого обучения: автоматизированный способ узнать чувства ваших клиентов Машина, предсказывающая ваши эмоции на основе того, что вы говорите / пишете. Поистине потрясающая концепция… !!! Представьте, что у вас есть 1 миллион покупателей для вашего продукта. Тысячи из них пишут отзывы о продукте. Как вы знаете, эти обзоры - лучший способ понять, насколько ваш продукт принят на рынке. Читать все эти отзывы и понимать чувства клиентов - утомительное..