Публикации по теме 'nlp'


Система поиска патентов по химии
http://ichemist.ai — это поисковая система, которую мы разработали, чтобы помочь исследователям находить информацию по химии, которая фигурирует в патентах. (если ссылка выше не работает, посмотрите наши демо-ролики на https://www.youtube.com/playlist?list=PLZ0CqxpJ8nQsPeIg5QowE1s5esIONoFQt ) Мы используем данные патентов на химию и индексируем текст формулы изобретения в нашей базе данных. Мы обрабатываем текст претензии, чтобы извлечь именованные сущности, характерные для этого..

Как использовать Pytorch Dataloaders для работы с очень большими текстовыми файлами
Классы Pytorch Dataset и Dataloader обеспечивают очень удобный способ итерации по набору данных при обучении вашей модели машинного обучения. Обычно это делается путем определения подкласса класса набора данных PyTorch и последующего обертывания его объекта с помощью загрузчика данных. Затем этот загрузчик данных используется для выборки данных из набора данных во время обучения. Однако этот подход может потребовать от вас сохранения полных данных в памяти (вы можете избежать этого,..

Играем с XLNet
XLNet - это самая последняя модель, выпущенная Google и CMU, которая превзошла BERT в нескольких последующих задачах. В этой статье я помогу вам получить вложения слов из предварительно обученной модели, выпущенной XLNet, а также поиграю с ней, как на поиск наиболее похожих слов для данного слова. text = "The metamorphic rocks of western Crete form a series some 9000 to 10,000 ft." Допустим, мы хотим найти вложения слов для каждого слова в предложении выше. Модель..

Простой поиск NLP в вашем приложении - пошаговое руководство на Scala
Полнотекстовый поиск прост в использовании. Но присущая естественным языкам неоднозначность приводит к смещению результатов поиска из-за ложных срабатываний. Чтобы получить более точные результаты, нам необходимо изменить подход и предоставить поисковой системе больше данных по предметной области. Самый распространенный и простой способ улучшить результаты поиска - это ввести фильтры, то есть несколько полей ввода (текстовые поля, переключатели и т. Д.), Названные в честь свойств. Таким..

🌳📖💻#4:😶 — POS-удаление
Безусловно универсальные речи Посмотрите на вещь , проверьте код , читайте ниже, если вам интересно :) Люди много говорят. Политические речи, например, имеют тенденцию быть длинными (но, честно говоря, речи всех). Итак, сегодня, играя с лингвистической концепцией Language Universals , я написал некоторый код, который пропалывает речи, удаляя все, кроме существительных и глаголов. Последующее чтение речи позволяет сделать, может быть, задумчивый, может быть, показательный,..

Перевод с RNN
Перевод с RNN Часть 4: Двунаправленный и внимание RNN В полном руководстве по НЛП с фастаем Перейдите по ссылке на всю серию, нажав здесь: Полное руководство по НЛП с фастай В этом посте будет собрано все, что мы узнали до этого момента, а затем представлен перевод с помощью RNN. Это захватывающе, потому что результаты нашего путешествия по изучению НЛП можно резюмировать следующим образом: В восторге??? Начнем… Перевод с RNN В этом посте мы займемся переводом...

Взгляд на основные направления ODSC Europe 2020
В сентябре этого года Виртуальная конференция ODSC Europe 2020 будет посвящена темам, которые будут актуальны в науке о данных в 2020 и 2021 годах. последний год или около того они постоянно развиваются и раздвигают границы области науки о данных. [Статья по теме: Как убедить своего босса посетить ODSC Europe 2020 ] ML/DL Эксперты в области машинного обучения и глубокого обучения обсудят последние достижения, тенденции и модели в этих быстро развивающихся областях...