Нежелательный фоновый шум в немецком выводе Google Assistant SSML

Я заметил, что есть фоновый шум, когда я вывожу одиночные цифры, за которыми следует <break>. Я использую немецкий женский голос 1. У меня есть следующая разметка SSML для воспроизведения этого поведения:

<speak>
   <prosody rate="medium">
      <s>
         <say-as interpret-as="cardinal">0</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">1</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">2</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">3</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">4</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">5</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">6</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">7</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">8</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">9</say-as><break time="1250ms"/>
         <say-as interpret-as="cardinal">0</say-as>
      </s>
   </prosody>
</speak>

Также я хотел бы предоставить ссылку на mp3 (созданный с помощью TTS Simulator, немецкий, женский голос 1). Вы можете отчетливо слышать шум, особенно после цифр 0, 2, 3, 4, 6, 7. Этот эффект проявляется только в том случае, если после <say-as interpret-as="cardinal"> стоит <break>.

Я ожидаю, что с такой SSML-разметкой вообще не будет фонового шума.

Я использую приведенную выше разметку, чтобы сообщить пользователю номер телефона, поскольку <say-as interpret-as="telephone">01234567890</say-as> произносит цифры слишком быстро.


person oliverschwarz    schedule 25.04.2018    source источник
comment
Мы зарегистрировали ошибку по этой проблеме.   -  person Leon Nicholls    schedule 28.09.2018


Ответы (1)


Попробуйте следующее:

<speak>
   <prosody rate="medium"> 
         <s><say-as interpret-as="cardinal">0</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">1</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">2</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">3</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">4</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">5</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">6</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">7</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">8</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">9</say-as></s><break time="1250ms"/>
         <s><say-as interpret-as="cardinal">0</say-as></s>
   </prosody>
</speak>
person Leon Nicholls    schedule 10.10.2018