Публикации по теме 'machine-translation'


[CHI2022] Поддержка изучения словарного запаса с использованием машинного перевода, позволяющая знакомиться с иностранными…
На ACM CHI 2022 Аракава (Университет Карнеги-Меллона) и Якура (Университет Цукуба) в сотрудничестве с Dr. Кобаяши (Университет Тохоку) , опубликовал статью под названием VocanEncounter: изучение словарного запаса на основе NMT путем внедрения компьютерных вариантов использования иностранных слов в повседневную жизнь пользователей . В этой статье мы хотели бы кратко представить содержание статьи. VocabEncounter: изучение словарного запаса на основе NMT..

Сентябрь 2022 г.: 10 новых языков в каталоге машинного перевода, стратегии резкого увеличения рентабельности инвестиций в машинный перевод и многое другое
В дайджесте этого месяца мы расскажем о 10 новых языках, добавленных в каталог Intento MT, о замечательных результатах машинного перевода и речевых технологий и многом другом. Наслаждаться! 🗣 25 новых языков от Google, 10 из которых являются новыми для Intento 🚀 Замечательные результаты от машинного перевода и речевых технологий 🌎 Интеграция Amazon ACT с Intento 🤖 Машинные голосовые решения с ULG 📚 Отличное чтение со всего сообщества AI и MT Google добавляет 10 новых языков в..

Вопросы по теме 'machine-translation'

Python: запрос на перевод Goslate возвращает 503: служба недоступна
Несколько месяцев назад я использовал пакет Python goslate для перевода набора французского текста на английский. Однако, когда я попытался сделать это сегодня утром, служба вернула ошибку: import goslate gs = goslate.Goslate() print...
3802 просмотров

IBM Watson Language Translation — правильный способ обучения с использованием параллельного корпуса
У меня есть несколько переведенных статей, которые я хочу использовать в качестве обучающих данных для языкового перевода IBM Watson. Как правильно использовать эти статьи для обучения? Использовать ли всю статью и ее перевод как запись в...
268 просмотров

Обучение обученной модели seq2seq на дополнительных данных обучения
Я обучил модель seq2seq с образцами 1M и сохранил последнюю контрольную точку. Теперь у меня есть дополнительные обучающие данные из 50 тысяч пар предложений, которых не было в предыдущих обучающих данных. Как я могу адаптировать текущую модель к...
325 просмотров

Существуют ли методы глубокого обучения для сходства строк в машинном переводе?
Я заинтересован в машинном переводе и, более конкретно, я хотел бы изучить сходство между двумя строками. Я хотел бы знать, существуют ли методы глубокого обучения для извлечения текстовых признаков. Я уже пробовал знаменитые статистические методы,...
1573 просмотров

Почему в документе для первого внимания не используются вложения слов (Glove, word2vecetc)?
В статье Нейронный машинный перевод путем совместного обучения выравниванию и переводу Bahdanau et. al. почему не используются вложения слов, такие как Glove или word2vec? Я понимаю, что это была статья 2014 года, но текущие реализации статьи на...
225 просмотров

Как использовать оценку BLEU для сравнения вашей модели с существующими моделями?
Поэтому я использую показатель BLEU для сравнения производительности моей модели NMT с существующими моделями. Однако мне интересно, сколько настроек мне нужно, чтобы сопоставить с другими моделями. Я думаю, что такие настройки, как наборы...
385 просмотров
schedule 29.07.2022

Как добавить службу текстового переводчика в мою учетную запись Azure
У меня есть учетная запись Azure, и я хочу активировать в ней функцию машинного перевода, описанную здесь? https://azure.microsoft.com/en-ca/services/cognitive-services/translator-text-api/ Но я не могу найти эту службу на портале Azure....
1209 просмотров
schedule 08.03.2022

TF2.0: модель трансляции: ошибка при восстановлении сохраненной модели: неразрешенный объект в контрольной точке (корень) .optimizer.iter: атрибуты
Я пытаюсь восстановить контрольные точки и прогнозировать по различным предложениям Модель внимания NMT . При восстановлении контрольных точек и прогнозировании я получаю тарабарщину с предупреждением ниже: Unresolved object in checkpoint...
9053 просмотров

Высокоточный алгоритм выравнивания слов в Python
Я работаю над проектом по построению высокоточного выравнивания слов между предложениями и их переводами на другие языки для измерения качества перевода. Я знаю о Giza++ и других инструментах выравнивания слов, которые используются как часть процесса...
1796 просмотров
schedule 04.05.2024

Конфликты в обучающих данных для Microsoft Custom Translator
Я использую Microsoft Custom Translator и предоставляю данные для обучения в формате tmx. В моих тренировочных данных есть некоторые противоречия. Например, у меня есть данные обучения с английского на немецкий, где у меня есть повторяющиеся...
74 просмотров

Перевод в реальном времени с помощью Alibaba Cloud
Кто-нибудь пробовал использовать Alibaba Cloud SDK для создания приложений для видеозвонков в реальном времени? Когда я прошу службу поддержки, они сказали, что услуга видеозвонков недоступна для международного облака Alibaba, а для китайского -...
52 просмотров

Указание предложения в задачах нейронного машинного перевода
Я видел много людей, работающих над нейронным машинным переводом. Обычно они представляют свое предложение между тегами <BOS><EOS> , <START><END> и т. д. перед обучением сети. Конечно, указывать начало и конец предложения...
50 просмотров

Как рассчитать BLEU Score без штрафа за краткость
код: import nltk from nltk.translate.bleu_score import sentence_bleu score1 = sentence_bleu(ref1, cand) Как я могу игнорировать штраф за краткость из рассчитанного здесь балла BLEU?
32 просмотров
schedule 09.05.2024

Как можно передать несколько текстовых параметров в API DeepL с помощью Python?
Я пытаюсь передать несколько текстовых переменных с помощью DeepL API, используя библиотеку Python 3 requests , но пока не смог передать несколько текстовых параметров в запрос. В документации указано, что до 50 текстовых параметров могут быть...
49 просмотров

Как я могу загрузить набор данных torchtext для задачи машинного перевода в pytorch?
Я новичок в torchtext . Я использовал набор данных Multi30k для изучения основ. В процессе изучения основ я хотел использовать другие наборы данных, такие как IWSLT2017 . Я прочитал документацию, и они показали мне, как я могу загрузить данные....
22 просмотров