Публикации по теме 'nlp'
Система поиска патентов по химии
http://ichemist.ai — это поисковая система, которую мы разработали, чтобы помочь исследователям находить информацию по химии, которая фигурирует в патентах.
(если ссылка выше не работает, посмотрите наши демо-ролики на https://www.youtube.com/playlist?list=PLZ0CqxpJ8nQsPeIg5QowE1s5esIONoFQt )
Мы используем данные патентов на химию и индексируем текст формулы изобретения в нашей базе данных. Мы обрабатываем текст претензии, чтобы извлечь именованные сущности, характерные для этого..
Как использовать Pytorch Dataloaders для работы с очень большими текстовыми файлами
Классы Pytorch Dataset и Dataloader обеспечивают очень удобный способ итерации по набору данных при обучении вашей модели машинного обучения. Обычно это делается путем определения подкласса класса набора данных PyTorch и последующего обертывания его объекта с помощью загрузчика данных. Затем этот загрузчик данных используется для выборки данных из набора данных во время обучения. Однако этот подход может потребовать от вас сохранения полных данных в памяти (вы можете избежать этого,..
Играем с XLNet
XLNet - это самая последняя модель, выпущенная Google и CMU, которая превзошла BERT в нескольких последующих задачах.
В этой статье я помогу вам получить вложения слов из предварительно обученной модели, выпущенной XLNet, а также поиграю с ней, как на поиск наиболее похожих слов для данного слова.
text = "The metamorphic rocks of western Crete form a series some 9000 to 10,000 ft."
Допустим, мы хотим найти вложения слов для каждого слова в предложении выше. Модель..
Простой поиск NLP в вашем приложении - пошаговое руководство на Scala
Полнотекстовый поиск прост в использовании. Но присущая естественным языкам неоднозначность приводит к смещению результатов поиска из-за ложных срабатываний. Чтобы получить более точные результаты, нам необходимо изменить подход и предоставить поисковой системе больше данных по предметной области.
Самый распространенный и простой способ улучшить результаты поиска - это ввести фильтры, то есть несколько полей ввода (текстовые поля, переключатели и т. Д.), Названные в честь свойств. Таким..
🌳📖💻#4:😶 — POS-удаление
Безусловно универсальные речи
Посмотрите на вещь , проверьте код , читайте ниже, если вам интересно :)
Люди много говорят.
Политические речи, например, имеют тенденцию быть длинными (но, честно говоря, речи всех).
Итак, сегодня, играя с лингвистической концепцией Language Universals , я написал некоторый код, который пропалывает речи, удаляя все, кроме существительных и глаголов. Последующее чтение речи позволяет сделать, может быть, задумчивый, может быть, показательный,..
Перевод с RNN
Перевод с RNN
Часть 4: Двунаправленный и внимание RNN
В полном руководстве по НЛП с фастаем
Перейдите по ссылке на всю серию, нажав здесь: Полное руководство по НЛП с фастай
В этом посте будет собрано все, что мы узнали до этого момента, а затем представлен перевод с помощью RNN.
Это захватывающе, потому что результаты нашего путешествия по изучению НЛП можно резюмировать следующим образом:
В восторге??? Начнем…
Перевод с RNN
В этом посте мы займемся переводом...
Взгляд на основные направления ODSC Europe 2020
В сентябре этого года Виртуальная конференция ODSC Europe 2020 будет посвящена темам, которые будут актуальны в науке о данных в 2020 и 2021 годах. последний год или около того они постоянно развиваются и раздвигают границы области науки о данных.
[Статья по теме: Как убедить своего босса посетить ODSC Europe 2020 ]
ML/DL
Эксперты в области машинного обучения и глубокого обучения обсудят последние достижения, тенденции и модели в этих быстро развивающихся областях...