Генерация музыки с помощью ИИ развивается довольно быстро, но у большинства инструментов долгое время была одна общая особенность: они охотно добавляли вокал туда, где он не был нужен. Хотите атмосферный фоновый трек для видео или спокойную инструментальную тему – получаете певца в комплекте. MiniMax решила закрыть этот пробел в своей модели Music 2.5, выпустив обновление под названием Music 2.5+.
Что изменилось
Главное нововведение – возможность явно указать, нужен ли вокал в треке. Проще говоря, теперь можно попросить модель сгенерировать чисто инструментальную музыку, и она именно это и сделает – без случайно появившегося голоса.
До этого обновления модель могла добавить вокальную партию, даже когда в описании об этом ничего не говорилось. Теперь пользователь сам управляет этим параметром: хотите – включаете вокал, хотите – отключаете.
Зачем это нужно на практике
Инструментальная музыка – это отдельный и очень востребованный формат. Её используют везде: в подкастах как фоновую подложку, в видеороликах и рекламе, в играх и приложениях, в учебных материалах. Голос в таких случаях мешает, так как он конкурирует с основным содержанием.
Для независимых авторов, которые создают контент без большого бюджета, возможность быстро сгенерировать подходящий инструментальный трек по текстовому описанию – это реальная экономия времени. Раньше приходилось либо искать подходящий трек в библиотеках стоковой музыки, либо вручную убирать вокал из готового результата.
Как это работает – в двух словах
Модель принимает текстовое описание того, какую музыку нужно создать, – например, «спокойная фортепианная мелодия с лёгкими струнными» – и генерирует трек на его основе. Теперь к этому добавился явный контроль над наличием или отсутствием вокала.
Это не принципиально новая архитектура – скорее важное расширение функциональности, которое делает модель пригодной для более широкого круга задач.
Music 2.5+ в контексте линейки
Music 2.5 – это музыкальная модель компании MiniMax, которая позиционирует себя как универсальный инструмент для генерации аудио по описанию. Версия 2.5+ не меняет модель целиком, а добавляет к ней конкретный режим работы – инструментальный.
Название с плюсом здесь скорее говорит о точечном улучшении, а не о полноценном следующем поколении. Это обычная практика в разработке ИИ-инструментов: выпустить промежуточное обновление, которое закрывает конкретный запрос пользователей, не переписывая всё с нуля.
Что остаётся открытым
Контроль над наличием вокала – это один параметр из многих, которые влияют на качество и пригодность сгенерированной музыки. Насколько точно модель следует текстовому описанию, насколько стабильно она держит нужное настроение и темп, как она справляется с нестандартными запросами – всё это по-прежнему зависит от конкретного случая и требует проверки в реальных условиях.
Тем не менее сам факт появления явного управления вокалом – это шаг в сторону более предсказуемого инструмента. А предсказуемость в творческих инструментах ценится не меньше, чем качество результата.