КП - Новосибирск,
06:50, 06.05.2026
Тут могла бы быть ваша реклама
Специалисты Новосибирского государственного технического университета разработали программное обеспечение для генерации аудиоконтента с помощью нейросетей. Система способна создавать музыку, вокал и звуковые эффекты по текстовому описанию.
Как сообщил ТАСС руководитель проекта Егор Антонянц, программа работает автономно и не требует подключения к зарубежным платформам. Она запускается на обычных компьютерах с объемом видеопамяти менее 6 ГБ и поддерживает популярные форматы — WAV, MP3 и FLAC.
Разработчики дообучили модель для трех типов контента: инструментальной музыки, песен с вокалом и звуковых эффектов. Это позволяет точнее соответствовать запросу пользователя и избегать смешения характеристик.
Система адаптирована для русскоязычных пользователей и показывает высокое качество генерации. Средняя оценка результата составила 4,1 балла из 5, что сопоставимо с коммерческими сервисами.
По словам разработчика Артура Хусаинова, процесс создания аудио проходит в несколько этапов: сначала формируется структура композиции, затем выполняется синтез звука, после чего файл экспортируется в нужный формат. В программе есть удобный интерфейс для управления проектами и предпрослушивания треков.