Обобщение текста с использованием методов глубокого обучения

Я пытаюсь обобщить текстовые документы, относящиеся к юридическому домену.

Я имею в виду сайт deeplearning.net о том, как реализовать архитектуры глубокого обучения. Я прочитал немало исследовательских работ по обобщению документов (как по одному документу, так и по нескольким документам), но я не могу понять, как именно создается резюме для каждого документа.

После завершения обучения сеть стабилизируется на этапе тестирования. Поэтому, даже если я знаю набор функций (которые я вычислил), которые изучаются на этапе обучения, было бы трудно выяснить важность каждой функции (поскольку весовой вектор сети стабилизирован) во время тестирования. Этап, на котором я буду пытаться создать сводку для каждого документа.

Я долго пытался понять это, но тщетно.

Если кто-то работал над этим или имеет какие-либо идеи относительно того же, пожалуйста, дайте мне несколько указателей. Я действительно ценю твою помощь. Спасибо.


person abi    schedule 19.05.2014    source источник
comment
Этот вопрос лучше задать здесь: stats.stackexchange.com   -  person NorthCat    schedule 19.05.2014
comment
Спасибо за предложение. Сделаю.   -  person abi    schedule 19.05.2014


Ответы (2)


Я думаю, вам нужно быть немного более конкретным. Когда вы говорите «Я не могу понять, как именно создается сводка для каждого документа», вы имеете в виду, что не знаете, как интерпретировать изученные функции, или вы не понимаете алгоритм? Кроме того, «методы глубокого обучения» охватывают очень широкий спектр моделей — какую из них вы на самом деле пытаетесь использовать?

В общем случае модели глубокого обучения не изучают функции, понятные человеку (хотя вы, конечно, можете попытаться найти корреляции между заданными входными данными и соответствующими активациями в модели). Итак, если это то, о чем вы спрашиваете, на самом деле нет хорошего ответа. Если у вас возникли трудности с пониманием модели, которую вы используете, я, вероятно, смогу вам помочь :-) Дайте мне знать.

person anderso    schedule 20.05.2014
comment
Я использую сеть глубокого убеждения. Алгоритм в основном точно настраивает вектор признаков, и у меня будут только те, которые в некотором смысле важны для алгоритма (как вы сказали, это может не иметь смысла для людей). У меня есть набор функций, в основном униграммы (слова) после обучения сети, но мне нужно найти способ использовать эти функции для создания сводки для каждого документа. Как мне поступить, это моя проблема. - person abi; 21.05.2014

это серия блогов, в которой с самого начала подробно рассказывается о том, как работает обобщение текста, в недавнем исследовании используются модели, основанные на глубоком обучении seq2seq, эта серия блогов начинается с объяснения этой архитектуры до новейших подходов к исследованиям.

Кроме того, этот репозиторий собирает несколько реализаций построения модели суммирования текста, запускает эти модели в google colab и размещает данные на диске Google, поэтому независимо от того, насколько мощный ваш компьютер, вы можете использовать Google Colab, бесплатную систему для обучения своих глубоких моделей на

Если вы хотите увидеть суммирование текста в действии, вы можете использовать этот бесплатный API.

Я искренне надеюсь, что это поможет

person amr zaki    schedule 11.01.2020
comment
Я работал над этой проблемой в 2014 году :) И столько всего произошло после этого. Спасибо за ответ! - person abi; 13.01.2020