Публикации по теме 'nlp'
Мой пользовательский механизм рекомендаций Uber Eats
Примечание. Это не критическая статья о Uber Eats. Мне нравится этот сервис, и я регулярно им пользуюсь.
По моему опыту, в приложении Uber Eats легко ориентироваться, и в целом оно отлично справляется со своей задачей. Единственное разочарование, которое у меня было с самого начала использования приложения, — это то, как сильно нажимаются большие пищевые цепочки. По понятным причинам Uber почти наверняка не создаст возможность отфильтровывать «большие пищевые цепочки». Чтобы..
7 моделей на HuggingFace, о существовании которых вы, вероятно, не знали
Давайте рассмотрим некоторые нетрадиционные модели и архитектуры НЛП.
HugginFace был в центре внимания всех практиков НЛП (обработка естественного языка) своими библиотеками преобразователей и наборов данных . В 2020 году мы увидели несколько серьезных обновлений в обеих этих библиотеках, а также введение модельного хаба . Для большинства людей использование BERT является синонимом использования версии с весами, доступной в библиотеке трансформаторов HF .
В этом посте я..
Урок 8: Невидимые глубины RNN и LSTM: сила глубокого обучения в НЛП
Рекуррентные нейронные сети (RNN):
RNN — это тип нейронной сети с петлями обратной связи в рекуррентном слое. Это позволяет им сохранять информацию в памяти с течением времени и последовательно обрабатывать данные.
Долгосрочная кратковременная память (LSTM):
LSTM — это тип RNN, в котором помимо стандартных единиц измерения используются специальные единицы измерения. Эти специальные единицы включают в себя «ячейку памяти», которая может хранить информацию в памяти в течение длительных..
NLP Multi-label Classification for Pocket Articles: песня Python и SQLite
Введение
Если вы, как и я, занимаетесь наукой о данных в 2020-х годах, то вы можете понять, что индустрия данных растет, развивается и даже меняет парадигмы с головокружительной скоростью.
Так как же практикующему не отставать?
Ну, есть много способов. Есть MOOC, технические подкасты, видео на Youtube и (подсказка) блоги, учебные пособия и бесчисленное множество вещей, которые можно прочитать, просмотреть и сохранить для дальнейшего использования.
Однако при таком огромном..
Полное руководство по классификации текста с использованием PySpark MLlib
Введение
Задумывались ли вы когда-нибудь, публикуя на веб-сайтах социальных сетей что-то, что противоречит стандартам их сообщества, как они могут идентифицировать это и предпринять соответствующие действия?
Идея, стоящая за этим, называется Классификация , будь то классификация текста , классификация изображений , классификация видео или аудио классификация. Тем не менее, концепция остается прежней; мы пытаемся классифицировать релевантный и нерелевантный контент...
Инструмент НЛП для распознавания тем и категоризации документов — TopicModeling
В мире больших данных распознавание тем и кластеризация нескольких документов, веб-страниц, новостных статей и т. д. чрезвычайно полезны в различных бизнес-приложениях, от поисковых систем до порталов электронной коммерции.
В свете этого мы рады сообщить, что сегодня мы сделали еще один шаг к расширению нашего Intellexer API Service выпуском нового модуля — TopicModeling (в >Выберите продукт выберите TopicModeling).
TopicModeling – это новое решение для категоризации, которое..
[UCI ICS] В репозитории UCI ML представлены четыре важных проекта на хакатоне ML 2022
Первоначально опубликовано 6 июля 2022 г. UCI ICS. Автор Карен Фан.
С 18 по 29 мая в репозитории UCI Machine Learning (ML) прошел хакатон по машинному обучению 2022 . На протяжении всего хакатона участники взаимодействовали с членами UCI ML Repository и его наборами данных для создания творческих и значимых проектов. 3 июня организаторы хакатона провели церемонию награждения, на которой были рассмотрены представленные проекты и отмечены четыре победивших хака.
В целом лучший..