![](/upload/iblock/a6c/0cjxl1aei3t6z3tve41sqle7k3yqzw05/freepik_freepikMUZICANT_LIL.jpg)
Компания Stability AI (ведущая в мире по генеративному ИИ) разработала модель Stable Audio Open с открытым исходным кодом для аудиосэмплов и звукового дизайна. Благодаря ей любой человек может создать из текстового запроса звуковую дорожку.
Нейросеть может генерировать до 47 секунд сэмплов и звуковых эффектов. Виды звуков различны – начиная от барабанных битов, заканчивая элементами продакшна. Модель позволяет изменять аудиодорожки и переносить стили.
Главная особенность — пользователи могут настраивать модель на основе собственных данных под любой инструмент.
Stable Audio Open была обучена на данных Freesound и Free Music Archive. Это позволило компании запустить открытую аудиомодель, соблюдая при этом права создателя.
Stability AI сообщает, что модель предназначена для открытого и ответственного создания аудио. Компания призывает попробовать их продукт всех заинтересованных в звуке людей и дать дальнейшую обратную связь.