Публикации по теме 'language-model'


NeurIPS 2022 объявляет о своих выдающихся основных документах, выдающихся наборах данных и контрольных документах…
Конференция и семинар по системам обработки нейронной информации (NeurIPS) — одно из самых влиятельных ежегодных собраний для представления и обмена исследованиями в области систем обработки нейронной информации в их биологических, технологических, математических и теоретических аспектах. Нейрипс…

Вопросы по теме 'language-model'

Почему у меня плохое распознавание Sphinx4?
Я изучаю, как использовать Sphinx4 с помощью подключаемого модуля Maven для Eclipse. Я взял демонстрацию расшифровки, найденную на GitHub, и изменил ее, чтобы обработать собственный файл. Аудиофайл 16 бит, моно, 16 кГц. Это примерно 13 секунд. Я...
388 просмотров

Пакет NLTK для оценки недоумения (unigram)
Я пытаюсь рассчитать недоумение для данных, которые у меня есть. Код, который я использую: import sys sys.path.append("/usr/local/anaconda/lib/python2.7/site-packages/nltk") from nltk.corpus import brown from nltk.model import NgramModel from...
13804 просмотров
schedule 20.09.2022

Языковая модель nltk TypeError: ngarms () получила неожиданный аргумент ключевого слова «pad_symbol»
Я выполняю следующий код: from nltk.corpus import brown from nltk.model import Ngram lm = NgramModel(2, brown.words(categories='news'), estimator=None) Но я получил ошибку: Я действительно не знаю, почему у меня есть эта проблема;...
543 просмотров
schedule 15.04.2023

языковая модель с SRILM
Я пытаюсь построить языковую модель, используя SRILM. У меня есть список фраз, и я создаю модель, используя: ./ngram-count -text corpus.txt -order 3 -ukndiscount -interpolate -unk -lm corpus.lm После этого я попытался сделать пример, чтобы...
1461 просмотров
schedule 05.04.2022

Используйте пример Tensorflow LSTM PTB для оценки предложений
Я пытаюсь использовать пример LSTM, обученный согласно Tensorflow Пример LSTM . Этот пример позволяет получить недоумение на всей тестовой выборке. Но мне нужно использовать обученную модель для оценки (получения логарифмов) каждого предложения...
370 просмотров
schedule 12.06.2023

Как нормализовать вероятности слов в предложениях разной длины?
Допустим, у нас есть модель RNN, которая выводит вероятность слова с учетом контекста (или без контекста), обученного на корпусе. Мы можем связать вероятность каждого слова в последовательности, чтобы получить общую вероятность самого предложения....
1190 просмотров

TextLMDataBunch Проблема с памятью Языковая модель Fastai
У меня есть набор данных с 45 миллионами строк данных. У меня есть три графических процессора по 6 ГБ оперативной памяти. Я пытаюсь обучить языковую модель данным. Для этого я пытаюсь загрузить данные в виде пакета данных fastai. Но эта часть...
563 просмотров

Требуется ли позиционное кодирование для преобразования в языковом моделировании?
Я разрабатываю языковую модель, например https://pytorch.org/tutorials/beginner/transformer_tutorial.html . Мне непонятно - нужна ли здесь позиционная кодировка? Насколько я понимаю, это необходимо для задачи языкового перевода, потому что...
527 просмотров
schedule 20.03.2024

Тонкая настройка предварительно обученной языковой модели с помощью Simple Transformers
В своей статье «Тонкая настройка языковой модели для предварительно обученных трансформеров» Тилина Раджапаксе ( https://medium.com/skilai/language-model-fine-tuning-for-pre-trained-transformers-b7262774a7ee)rel= ) предоставляет следующий фрагмент...
873 просмотров

Что означает «тета» в языковой модели?
Я знаю, что если X обозначает текст, то p(X) обозначает языковую модель текста. И чаще всего мы используем оценку максимального правдоподобия для оценки языковой модели. Но во многих случаях я обнаруживаю, что параметр $\theta$ используется для...
186 просмотров