Докторант ТалТеха создал веб-сервис, клонирующий голос с обманчивой точностью
Докторант ТалТеха Айво Олев создал языково-технологический веб-сервис Jutusta.ee, который умеет переводить голосовые записи в текст, озвучивать написанный текст человеческим голосом и клонировать голос самого пользователя. Результат настолько убедителен, что даже близкие люди не могут отличить оригинал от копии.
ТехнологииДокторант ТалТеха Айво Олев разработал эстоноязычный языково-технологический веб-сервис Jutusta.ee, который делает клонирование голоса доступным для рядового пользователя.
Что умеет Jutusta.ee?
Платформа предлагает три основные функции: преобразование голосовых записей в текст, озвучивание написанного текста человеческим голосом и — самое примечательное — клонирование собственного голоса пользователя. По словам Олева, качество клонирования настолько высоко, что даже члены семьи и близкие друзья не могут определить, является ли звучащий голос живым или его искусственно созданной копией.
Искусственный интеллект на эстонском языке
Jutusta.ee ориентирован прежде всего на эстоноязычного пользователя, что делает его заметным достижением на рынке эстонских речевых технологий. Эстонский — сравнительно малый язык, и разработка качественных решений в области речевых технологий требует специальной экспертизы и наборов данных.
Сервис неизбежно поднимает и вопросы о злоупотреблении дипфейк-аудио: если копия голоса настолько убедительна, что близкие не могут отличить её от оригинала, возникает вопрос — как защитить людей от возможного мошенничества.
Открыть в приложении →