OpenAI создала нейросетевую модель Voice Engine для воссоздания человеческого голоса по образцу, сообщает пресс-служба компании.
Для озвучки «клонированным» голосом нейросети достаточно представить аудиопример голоса человека, который нужно воссоздать, длиной 15 секунд.
Разработка модели началась в конце 2022 года. Нейросеть может озвучить текст на английском, французском, испанском, китайском и других языках. Система сохраняет особенности голоса «оригинала», что позволяет генерировать речь на других языках «с акцентом».
Несмотря на широкие возможности Voice Engine, компания OpenAI пока не открывает общественного доступа к данному сервису в целях безопасности.
В то же время OpenAI ведет переговоры с партнерами на тему прозрачности в использовании ИИ-озвучки и защиты от неправильного использования. По словам создателей, они внедрили в систему водяные знаки аудиоданных и другие меры безопасности.
OpenAI представила нейросеть Voice Engine для озвучки текстов с человеческим голосом
Американская компания OpenAI анонсировала новую нейросеть Voice Engine, которая может по 15-секундному отрывку голоса скопировать его и озвучить написанный текст, стараясь наиболее точно передать речевые особенности и голос говорящего. В компании утверждают, что запретят использовать нейросеть для того, чтобы выдавать себя за другого человека.
![OpenAI представила нейросеть Voice Engine для озвучки текстов с человеческим голосом](/_next/image?url=https%3A%2F%2Fvzglyad.uz%2Fwp-content%2Fuploads%2F2024%2F04%2Fphoto_2024-04-02_13-49-44.jpg&w=1536&q=75)