Статьи по теме language-model

Публикации по теме 'language-model'

NeurIPS 2022 объявляет о своих выдающихся основных документах, выдающихся наборах данных и контрольных документах…

Конференция и семинар по системам обработки нейронной информации (NeurIPS) — одно из самых влиятельных ежегодных собраний для представления и обмена исследованиями в области систем обработки нейронной информации в их биологических, технологических, математических и теоретических аспектах. Нейрипс…

Вопросы по теме 'language-model'

Почему у меня плохое распознавание Sphinx4?

Я изучаю, как использовать Sphinx4 с помощью подключаемого модуля Maven для Eclipse. Я взял демонстрацию расшифровки, найденную на GitHub, и изменил ее, чтобы обработать собственный файл. Аудиофайл 16 бит, моно, 16 кГц. Это примерно 13 секунд. Я...

388 просмотров

16.11.2022

Пакет NLTK для оценки недоумения (unigram)

Я пытаюсь рассчитать недоумение для данных, которые у меня есть. Код, который я использую: import sys sys.path.append("/usr/local/anaconda/lib/python2.7/site-packages/nltk") from nltk.corpus import brown from nltk.model import NgramModel from...

13804 просмотров

python-2.7 nlp nltk language-model n-gram

20.09.2022

Языковая модель nltk TypeError: ngarms () получила неожиданный аргумент ключевого слова «pad_symbol»

Я выполняю следующий код: from nltk.corpus import brown from nltk.model import Ngram lm = NgramModel(2, brown.words(categories='news'), estimator=None) Но я получил ошибку: Я действительно не знаю, почему у меня есть эта проблема;...

543 просмотров

python nlp nltk language-model n-gram

15.04.2023

языковая модель с SRILM

Я пытаюсь построить языковую модель, используя SRILM. У меня есть список фраз, и я создаю модель, используя: ./ngram-count -text corpus.txt -order 3 -ukndiscount -interpolate -unk -lm corpus.lm После этого я попытался сделать пример, чтобы...

1461 просмотров

nlp language-model n-gram srilm

05.04.2022

Используйте пример Tensorflow LSTM PTB для оценки предложений

Я пытаюсь использовать пример LSTM, обученный согласно Tensorflow Пример LSTM . Этот пример позволяет получить недоумение на всей тестовой выборке. Но мне нужно использовать обученную модель для оценки (получения логарифмов) каждого предложения...

370 просмотров

tensorflow lstm language-model scoring

12.06.2023

Как нормализовать вероятности слов в предложениях разной длины?

Допустим, у нас есть модель RNN, которая выводит вероятность слова с учетом контекста (или без контекста), обученного на корпусе. Мы можем связать вероятность каждого слова в последовательности, чтобы получить общую вероятность самого предложения....

1190 просмотров

machine-learning nlp deep-learning language-model rnn

01.02.2023

TextLMDataBunch Проблема с памятью Языковая модель Fastai

У меня есть набор данных с 45 миллионами строк данных. У меня есть три графических процессора по 6 ГБ оперативной памяти. Я пытаюсь обучить языковую модель данным. Для этого я пытаюсь загрузить данные в виде пакета данных fastai. Но эта часть...

563 просмотров

pytorch nlp out-of-memory fast-ai language-model

13.02.2023

Требуется ли позиционное кодирование для преобразования в языковом моделировании?

Я разрабатываю языковую модель, например https://pytorch.org/tutorials/beginner/transformer_tutorial.html . Мне непонятно - нужна ли здесь позиционная кодировка? Насколько я понимаю, это необходимо для задачи языкового перевода, потому что...

527 просмотров

transformer language-model

20.03.2024

Тонкая настройка предварительно обученной языковой модели с помощью Simple Transformers

В своей статье «Тонкая настройка языковой модели для предварительно обученных трансформеров» Тилина Раджапаксе ( https://medium.com/skilai/language-model-fine-tuning-for-pre-trained-transformers-b7262774a7ee)rel= ) предоставляет следующий фрагмент...

873 просмотров

python-3.x simpletransformers huggingface-transformers language-model

13.12.2022

Что означает «тета» в языковой модели?

Я знаю, что если X обозначает текст, то p(X) обозначает языковую модель текста. И чаще всего мы используем оценку максимального правдоподобия для оценки языковой модели. Но во многих случаях я обнаруживаю, что параметр $\theta$ используется для...

186 просмотров

nlp stanford-nlp language-model n-gram information-retrieval

05.10.2022

Публикации по теме 'language-model'

NeurIPS 2022 объявляет о своих выдающихся основных документах, выдающихся наборах данных и контрольных документах…

Вопросы по теме 'language-model'

Похожие вопросы