Возможно ли программно взять образец чьего-то голоса и создать уникальный тон/свойство, которое можно использовать для создания синтезированной речи?
Например, человек А записывает себя. Из этого образца голоса создается уникальный тон, который преобразуется в синтезированную речь. Это позволяет людям использовать этот синтетический голос в программном обеспечении для преобразования текста в речь, записывая любой текст, который они хотят, который будет прочитан голосом человека А.
Возможно ли это в сегодняшних условиях? Я знаю, что есть компании, которые занимаются этим профессионально, но в целом возможно ли это с помощью программного обеспечения?