Если следить за развитием рынка открытых ИИ-моделей, то выход Google Gemma 4 – заметное событие. Не потому что это «революция» (это слово давно обесценилось в контексте ИИ), а потому что происходит нечто конкретное: большие возможности начинают умещаться в очень маленькие устройства.
Четыре модели вместо одной
Gemma 4 – это не одна модель, а целое семейство из четырёх вариантов, рассчитанных на разные устройства и задачи. Если коротко: два компактных варианта предназначены для смартфонов, два более крупных – для ПК и серверов.
Компактные версии, E2B и E4B, содержат 2 и 4 миллиарда параметров соответственно. Параметры – это, грубо говоря, «знания» модели: чем их больше, тем модель обычно умнее, но и тем больше ресурсов ей нужно. Google разрабатывала эти версии совместно с Qualcomm и MediaTek – производителями чипов, которые стоят во многих современных смартфонах. Цель конкретна: модели должны работать прямо на устройстве, без обращения к облаку, и при этом экономно расходовать память и заряд батареи.
Две старшие модели – 26B с архитектурой «смесь экспертов» и 31B Dense – рассчитаны на более мощное аппаратное обеспечение, но тоже умещаются на одном графическом процессоре. Это важно для тех, кто хочет запускать серьёзный ИИ локально, не арендуя облачные мощности.
Что умеют эти модели
Все четыре варианта Gemma 4 умеют работать с текстом, изображениями и видео. Компактные версии E2B и E4B дополнительно понимают аудио – то есть могут распознавать речь прямо на устройстве, без интернета.
Контекстное окно у компактных моделей – до 128 тысяч токенов, у старших – до 256 тысяч. Токен – это примерно слово или его часть. Проще говоря, модели способны «держать в голове» очень длинные тексты или разговоры, не теряя нить.
Отдельно стоит отметить, что Gemma 4 изначально проектировалась для так называемых агентных сценариев – когда модель не просто отвечает на вопросы, а самостоятельно выполняет цепочки действий: вызывает инструменты, генерирует структурированные ответы, принимает решения на основе контекста. Это направление сейчас активно развивается в индустрии, и Gemma 4 встраивается в него нативно.
Все модели поддерживают более 140 языков. Русский – в их числе.
Цифры, которые удивляют
Google утверждает, что добилась «беспрецедентного уровня интеллекта на один параметр» – и это не просто маркетинговая фраза. Старшая модель, 31B Dense, заняла третье место среди открытых моделей в независимом рейтинге Arena AI, обойдя при этом системы, которые в 20 раз больше по размеру. Модель на 26 миллиардов параметров заняла шестое место в том же рейтинге.
Для сравнения: 31 миллиард параметров – это не так уж и много по меркам современных флагманских моделей. Некоторые конкуренты оперируют сотнями миллиардов параметров. Тем не менее Gemma 4 31B уверенно конкурирует с ними, что говорит о заметном прогрессе в эффективности архитектуры.
Кроме того, Gemma 4 в целом превосходит предыдущее поколение – Gemma 3 – практически на всех стандартных тестах. Исключение составляет лишь самая маленькая версия E2B, которая в отдельных тестах немного уступает более крупной Gemma 3 27B. Что, в общем-то, логично: 2 миллиарда параметров против 27 миллиардов – разница в размере всё равно даёт о себе знать.
Почему это важно за пределами цифр
Запуск Gemma 4 – часть более широкой тенденции: ИИ постепенно перемещается с серверов на устройства. Это меняет то, как люди взаимодействуют с технологией.
Когда модель работает локально, данные никуда не уходят. Это актуально для тех, кто работает с чувствительной информацией или просто не хочет, чтобы его запросы обрабатывались на чужих серверах. Локальный запуск также означает работу без интернета, что открывает возможности для устройств в труднодоступных местах или в условиях нестабильного соединения.
Для разработчиков интерес ещё и в другом: Gemma 4 распространяется под лицензией Apache 2.0 – одной из самых либеральных в мире открытого программного обеспечения. Это значит, что модели можно использовать в коммерческих продуктах, модифицировать и встраивать в собственные решения практически без ограничений. Предыдущие версии Gemma выходили под собственной лицензией Google, которая накладывала дополнительные условия.
С момента появления первой Gemma разработчики скачали модели более 400 миллионов раз и создали свыше 100 тысяч производных вариантов. Gemma 4 строится на этом фундаменте, и с более открытой лицензией это сообщество, вероятно, будет расти дальше.
Где скачать и как попробовать
Все четыре модели уже доступны для загрузки – как базовые версии, так и версии с предварительной настройкой под диалог. Веса опубликованы на нескольких крупных платформах для работы с ИИ-моделями, а также поддерживаются популярными инструментами для локального запуска. Базовые версии тоже открыты, что позволяет дообучать модели под конкретные задачи.
Технический отчёт с подробным описанием архитектуры и методологии на момент релиза опубликован не был – это остаётся открытым вопросом для тех, кто хочет разобраться в деталях.
В целом Gemma 4 выглядит как серьёзная заявка Google на то, чтобы занять заметное место в сегменте локального ИИ – там, где важны не только способности модели, но и то, насколько легко её развернуть, использовать и адаптировать под себя.