API переводчика изменяет содержимое некоторых тегов в режиме text / html.

Используя метод TranslateArray Microsoft Translator Text API с опцией ContentType в режиме text / html, изменяет содержимое некоторых тегов, извлекая часть «важного» текста из тега. Эти «изменения» не кажутся оправданными синтаксическими корректировками перевода. Пример перевода с «EN» на «RU» Фрагмент исходного текста:

Загрузите название программы и откройте для себя удобство управления рекламными кампаниями или отправки сообщений на мобильные телефоны со своего компьютера.

Фрагмент переведенного текста:

Скачать Название программы и откройте для себя удобство управления рекламными кампаниями или отправка сообщений на мобильные телефоны с вашего компьютера.

Текст «или отправка сообщений на мобильные телефоны с вашего компьютера». Эквивалент «или отправка сообщений на мобильные с вашего компьютера» теперь не является сильным признаком. Есть ли способ заставить API уважать теги?


person Diego    schedule 06.06.2017    source источник


Ответы (1)


есть только один способ повлиять на обработку тегов - использовать contentType text / html вместо text / plain. Порядок слов в переводе может сильно отличаться от порядка слов в оригинале, а теги перемещаются вместе со словами, к которым они прикреплены. Слово, к которому прикреплен тег, может иногда появляться случайным образом.

В этом конкретном случае вы получите лучшее размещение тегов при использовании нейронного декодера Microsoft Translator, вызываемого & category = generalnn. Но в настоящее время вы не захотите переключаться на нейронную связь для сильно помеченного контента. На данный момент размещение тегов в нейронных сетях хуже, в большинстве случаев, кроме вашего.

person Chris Wendt    schedule 09.06.2017