Я заметил, что есть фоновый шум, когда я вывожу одиночные цифры, за которыми следует <break>
. Я использую немецкий женский голос 1. У меня есть следующая разметка SSML для воспроизведения этого поведения:
<speak>
<prosody rate="medium">
<s>
<say-as interpret-as="cardinal">0</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">1</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">2</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">3</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">4</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">5</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">6</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">7</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">8</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">9</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">0</say-as>
</s>
</prosody>
</speak>
Также я хотел бы предоставить ссылку на mp3 (созданный с помощью TTS Simulator, немецкий, женский голос 1). Вы можете отчетливо слышать шум, особенно после цифр 0, 2, 3, 4, 6, 7. Этот эффект проявляется только в том случае, если после <say-as interpret-as="cardinal">
стоит <break>
.
Я ожидаю, что с такой SSML-разметкой вообще не будет фонового шума.
Я использую приведенную выше разметку, чтобы сообщить пользователю номер телефона, поскольку <say-as interpret-as="telephone">01234567890</say-as>
произносит цифры слишком быстро.