Генерация музыки с помощью ИИ – направление, которое развивается заметно тише, чем текст или изображения, но не менее интенсивно. Google DeepMind сделала в нём очередной шаг: представлена Lyria 3 Pro – обновлённая версия музыкальной модели, которая умеет создавать более длинные треки, при этом удерживая в уме, как устроена музыка в целом.
Не просто «ещё немного музыки»
Если коротко: предыдущие версии Lyria справлялись с короткими фрагментами, но при попытке сгенерировать что-то более длинное результат начинал «расползаться» – музыка теряла внутреннюю логику, повторения появлялись не там, где нужно, а структура напоминала случайный набор похожих кусков.
Lyria 3 Pro решает именно эту проблему. Модель теперь работает со структурной осознанностью – проще говоря, она понимает, что у трека есть вступление, развитие, кульминация и завершение. Она не просто продолжает звук, а строит музыкальное произведение с учётом того, где оно находится и куда движется.
Такой подход ближе к тому, как мыслит аранжировщик, а не к тому, как работает лупер, просто повторяющий заданный паттерн.
Длина – это не только время
Казалось бы, что сложного в том, чтобы просто генерировать музыку дольше? На практике – очень много. Длинный трек требует не только звукового качества, но и музыкальной памяти: модель должна помнить, какая тема была введена в начале, когда её стоит повторить, когда – видоизменить, а когда – убрать совсем.
Именно это отличает полноценную музыкальную композицию от бесконечного «фона». И именно это Lyria 3 Pro теперь умеет делать лучше предшественников.
Для создателей контента, разработчиков игр или людей, которые ищут музыку для видео, это означает более пригодный результат «из коробки» – без ручной склейки фрагментов и без ощущения, что трек закончился раньше времени.
Lyria идёт в продукты Google
Параллельно с выходом Pro-версии Google расширяет присутствие Lyria в своих сервисах. Модель появляется в большем числе продуктов и платформ компании – хотя конкретный список пока формируется.
Это часть более широкой стратегии: Google последовательно встраивает свои ИИ-инструменты в экосистему продуктов, чтобы пользователи могли работать с ними там, где уже проводят время, – не переключаясь на отдельные сервисы.
В случае с музыкой это особенно логично: генерация звука наиболее полезна именно в контексте – при создании видео, в образовательных материалах, в играх или интерактивных проектах.
Что это значит для людей, которые делают контент
Для широкой аудитории – блогеров, авторов подкастов, независимых разработчиков – Lyria 3 Pro потенциально снижает барьер входа в работу с музыкой. Раньше создание полноценного трека требовало либо музыкальных знаний, либо найма специалиста, либо покупки лицензионной библиотеки.
Теперь это становится ближе к тому, чтобы просто описать, что нужно, и получить готовый результат – достаточно длинный и достаточно структурированный, чтобы использовать его без дополнительной обработки.
Конечно, это не значит, что профессиональные музыканты и композиторы стали не нужны. Но пространство задач, где ИИ-генерация даёт приемлемый результат быстро и дёшево, продолжает расширяться.
Открытые вопросы
Как и с любым инструментом генеративного ИИ, здесь остаются вопросы, на которые пока нет исчерпывающих ответов. Насколько хорошо модель справляется с нетиповыми жанрами? Как она работает с конкретными инструментальными составами? Можно ли управлять структурой вручную – или это пока остаётся на усмотрение модели?
Эти детали прояснятся по мере того, как инструмент станет доступен шире и пройдёт через реальное использование. Пока же – это заметный шаг вперёд в направлении, где до недавнего времени ИИ справлялся лишь с короткими набросками.