Американская компания OpenAI представила некоторые предварительные итоги испытаний Voice Engine — нейросети, которая умеет очень реалистично генерировать голоса реальных людей. Для этого ИИ нужно услышать одну запись голоса длительностью 15 секунд. Модель умеет создавать реалистичные и эмоционально окрашенные голоса.
В конце 2023 года OpenAI дала доступ к своей модели небольшой группе партнеров. Последние создали на основе Voice Engine несколько приложений, которые помогают читать тексты, переводить в реальном времени видео и подкасты, повышать качество оказания услуг.
Также нейросеть использовали для помощи людям, которые не могут говорить. Voice Engine возвращает таким людям голос, при этом наделяя возможностью говорить практически на всех языках. Кроме того, у пользователей появляется возможность выбирать голос, который наиболее точно отвечает их индивидуальным потребностям.
Еще одно применение модели — помощь в восстановлении голоса для пациентов, страдающих дегенеративными нарушениями речи.
В OpenAI отметили, что придерживаются осторожного подхода к развитию технологий генерации речи. Согласно правилам использования, с помощью Voice Engine нельзя выдавать себя за другое лицо, использовать модель можно только с согласия человека, предоставляющего паттерн голоса, а слушатели должны быть поставлены в известность о том, что голос сгенерирован нейросетью.
Компания также внедрила ряд активных мер безопасности, включая водяные знаки, позволяющие определить любой звук, созданный Voice Engine, а также возможность отслеживать использование сгенерированного контента. Еще один защитный барьер — голосовая аутентификация, подтверждающая согласие первоначального спикера на обработку его голоса моделью.
Кроме того, создатели нейросети призывают отказываться от голосовой аутентификации в банковских операциях, а также ускорить разработку и внедрение методов отслеживания происхождения аудиовизуального контента.
Ранее «Мир робототехники» писал, что специалисты компании Google разработали новый инструмент машинного обучения, который позволит оценивать функциональное состояние легких человека. Система искусственного интеллекта изучила миллионы записей кашля и дыхания, чтобы диагностировать такие заболевания, как туберкулез и COVID-19.
