Открытая модель для создания свободного звука

Компания Stability AI (ведущая в мире по генеративному ИИ) разработала модель Stable Audio Open с открытым исходным кодом для аудиосэмплов и звукового дизайна. Благодаря ей любой человек может создать из текстового запроса звуковую дорожку.

Нейросеть может генерировать до 47 секунд сэмплов и звуковых эффектов. Виды звуков различны – начиная от барабанных битов, заканчивая элементами продакшна. Модель позволяет изменять аудиодорожки и переносить стили.

Главная особенность — пользователи могут настраивать модель на основе собственных данных под любой инструмент.

Stable Audio Open была обучена на данных Freesound и Free Music Archive. Это позволило компании запустить открытую аудиомодель, соблюдая при этом права создателя.

Stability AI сообщает, что модель предназначена для открытого и ответственного создания аудио. Компания призывает попробовать их продукт всех заинтересованных в звуке людей и дать дальнейшую обратную связь.

25.06.2024
Владимир Именных
Фото: Freepik – Freepik

Мы рекомендуем:

Генетика под контролем ИИ: в России разрабатывают мощную платформу для анализа ДНК

Генетика под контролем ИИ: в России разрабатывают мощную платформу для анализа ДНК

Wybot S3: первый робот для бассейна с ультразвуком

Wybot S3: первый робот для бассейна с ультразвуком

Генетика под контролем ИИ: в России разрабатывают мощную платформу для анализа ДНК

Генетика под контролем ИИ: в России разрабатывают мощную платформу для анализа ДНК