Обобщение текста с использованием методов глубокого обучения

Я пытаюсь обобщить текстовые документы, относящиеся к юридическому домену.

Я имею в виду сайт deeplearning.net о том, как реализовать архитектуры глубокого обучения. Я прочитал немало исследовательских работ по обобщению документов (как по одному документу, так и по нескольким документам), но я не могу понять, как именно создается резюме для каждого документа.

После завершения обучения сеть стабилизируется на этапе тестирования. Поэтому, даже если я знаю набор функций (которые я вычислил), которые изучаются на этапе обучения, было бы трудно выяснить важность каждой функции (поскольку весовой вектор сети стабилизирован) во время тестирования. Этап, на котором я буду пытаться создать сводку для каждого документа.

Я долго пытался понять это, но тщетно.

Если кто-то работал над этим или имеет какие-либо идеи относительно того же, пожалуйста, дайте мне несколько указателей. Я действительно ценю твою помощь. Спасибо.

abi 19.05.2014 источник

comment

Этот вопрос лучше задать здесь: stats.stackexchange.com - NorthCat 19.05.2014

comment

Спасибо за предложение. Сделаю. - abi 19.05.2014

Ответы (2)

arrow_upward
2
arrow_downward

Я думаю, вам нужно быть немного более конкретным. Когда вы говорите «Я не могу понять, как именно создается сводка для каждого документа», вы имеете в виду, что не знаете, как интерпретировать изученные функции, или вы не понимаете алгоритм? Кроме того, «методы глубокого обучения» охватывают очень широкий спектр моделей — какую из них вы на самом деле пытаетесь использовать?

В общем случае модели глубокого обучения не изучают функции, понятные человеку (хотя вы, конечно, можете попытаться найти корреляции между заданными входными данными и соответствующими активациями в модели). Итак, если это то, о чем вы спрашиваете, на самом деле нет хорошего ответа. Если у вас возникли трудности с пониманием модели, которую вы используете, я, вероятно, смогу вам помочь :-) Дайте мне знать.

anderso 20.05.2014

comment

Я использую сеть глубокого убеждения. Алгоритм в основном точно настраивает вектор признаков, и у меня будут только те, которые в некотором смысле важны для алгоритма (как вы сказали, это может не иметь смысла для людей). У меня есть набор функций, в основном униграммы (слова) после обучения сети, но мне нужно найти способ использовать эти функции для создания сводки для каждого документа. Как мне поступить, это моя проблема. - abi; 21.05.2014

arrow_upward
0
arrow_downward

это серия блогов, в которой с самого начала подробно рассказывается о том, как работает обобщение текста, в недавнем исследовании используются модели, основанные на глубоком обучении seq2seq, эта серия блогов начинается с объяснения этой архитектуры до новейших подходов к исследованиям.

Кроме того, этот репозиторий собирает несколько реализаций построения модели суммирования текста, запускает эти модели в google colab и размещает данные на диске Google, поэтому независимо от того, насколько мощный ваш компьютер, вы можете использовать Google Colab, бесплатную систему для обучения своих глубоких моделей на

Если вы хотите увидеть суммирование текста в действии, вы можете использовать этот бесплатный API.

Я искренне надеюсь, что это поможет

amr zaki 11.01.2020

comment

Я работал над этой проблемой в 2014 году :) И столько всего произошло после этого. Спасибо за ответ! - abi; 13.01.2020

Обобщение текста с использованием методов глубокого обучения

Ответы (2)

Похожие вопросы