Я хочу найти условную вероятность слова с учетом его предыдущего набора слов. Я планирую использовать Google N-grams
для того же. Однако, будучи таким огромным ресурсом, я не думаю, что это вычислительно возможно сделать на моем ПК. (Чтобы обработать все N-граммы, обучить языковую модель).
Итак, есть ли способ обучить языковую модель с помощью Google Ngrams? (Даже библиотека python NLTK
больше не поддерживает языковую модель ngram
) Примечание. Я знаю, что языковую модель можно обучить с помощью ngrams, но, учитывая огромный размер N-грамм Google, как можно обучить языковую модель с использованием именно ngrams Google?