Опубликовано 9 апреля 2026

Google Gemma 4: новые ИИ-модели, которые работают на смартфонах

Google Gemma 4: открытые ИИ-модели, которые умещаются в смартфон

Google выпустила семейство открытых моделей Gemma 4 – от компактных версий для смартфонов до мощных решений для ПК, способных конкурировать с системами в разы крупнее.

Продукты 4 – 5 минут чтения
Источник события: Carnegie Mellon University 4 – 5 минут чтения

Если следить за развитием рынка открытых ИИ-моделей, то выход Google Gemma 4 – заметное событие. Не потому что это «революция» (это слово давно обесценилось в контексте ИИ), а потому что происходит нечто конкретное: большие возможности начинают умещаться в очень маленькие устройства.

Семейство моделей Google Gemma 4

Четыре модели вместо одной

Gemma 4 – это не одна модель, а целое семейство из четырёх вариантов, рассчитанных на разные устройства и задачи. Если коротко: два компактных варианта предназначены для смартфонов, два более крупных – для ПК и серверов.

Компактные версии, E2B и E4B, содержат 2 и 4 миллиарда параметров соответственно. Параметры – это, грубо говоря, «знания» модели: чем их больше, тем модель обычно умнее, но и тем больше ресурсов ей нужно. Google разрабатывала эти версии совместно с Qualcomm и MediaTek – производителями чипов, которые стоят во многих современных смартфонах. Цель конкретна: модели должны работать прямо на устройстве, без обращения к облаку, и при этом экономно расходовать память и заряд батареи.

Две старшие модели – 26B с архитектурой «смесь экспертов» и 31B Dense – рассчитаны на более мощное аппаратное обеспечение, но тоже умещаются на одном графическом процессоре. Это важно для тех, кто хочет запускать серьёзный ИИ локально, не арендуя облачные мощности.

Функциональные возможности Gemma 4

Что умеют эти модели

Все четыре варианта Gemma 4 умеют работать с текстом, изображениями и видео. Компактные версии E2B и E4B дополнительно понимают аудио – то есть могут распознавать речь прямо на устройстве, без интернета.

Контекстное окно у компактных моделей – до 128 тысяч токенов, у старших – до 256 тысяч. Токен – это примерно слово или его часть. Проще говоря, модели способны «держать в голове» очень длинные тексты или разговоры, не теряя нить.

Отдельно стоит отметить, что Gemma 4 изначально проектировалась для так называемых агентных сценариев – когда модель не просто отвечает на вопросы, а самостоятельно выполняет цепочки действий: вызывает инструменты, генерирует структурированные ответы, принимает решения на основе контекста. Это направление сейчас активно развивается в индустрии, и Gemma 4 встраивается в него нативно.

Все модели поддерживают более 140 языков. Русский – в их числе.

Производительность и рейтинги Gemma 4

Цифры, которые удивляют

Google утверждает, что добилась «беспрецедентного уровня интеллекта на один параметр» – и это не просто маркетинговая фраза. Старшая модель, 31B Dense, заняла третье место среди открытых моделей в независимом рейтинге Arena AI, обойдя при этом системы, которые в 20 раз больше по размеру. Модель на 26 миллиардов параметров заняла шестое место в том же рейтинге.

Для сравнения: 31 миллиард параметров – это не так уж и много по меркам современных флагманских моделей. Некоторые конкуренты оперируют сотнями миллиардов параметров. Тем не менее Gemma 4 31B уверенно конкурирует с ними, что говорит о заметном прогрессе в эффективности архитектуры.

Кроме того, Gemma 4 в целом превосходит предыдущее поколение – Gemma 3 – практически на всех стандартных тестах. Исключение составляет лишь самая маленькая версия E2B, которая в отдельных тестах немного уступает более крупной Gemma 3 27B. Что, в общем-то, логично: 2 миллиарда параметров против 27 миллиардов – разница в размере всё равно даёт о себе знать.

Значение локального ИИ и открытого кода Gemma 4

Почему это важно за пределами цифр

Запуск Gemma 4 – часть более широкой тенденции: ИИ постепенно перемещается с серверов на устройства. Это меняет то, как люди взаимодействуют с технологией.

Когда модель работает локально, данные никуда не уходят. Это актуально для тех, кто работает с чувствительной информацией или просто не хочет, чтобы его запросы обрабатывались на чужих серверах. Локальный запуск также означает работу без интернета, что открывает возможности для устройств в труднодоступных местах или в условиях нестабильного соединения.

Для разработчиков интерес ещё и в другом: Gemma 4 распространяется под лицензией Apache 2.0 – одной из самых либеральных в мире открытого программного обеспечения. Это значит, что модели можно использовать в коммерческих продуктах, модифицировать и встраивать в собственные решения практически без ограничений. Предыдущие версии Gemma выходили под собственной лицензией Google, которая накладывала дополнительные условия.

С момента появления первой Gemma разработчики скачали модели более 400 миллионов раз и создали свыше 100 тысяч производных вариантов. Gemma 4 строится на этом фундаменте, и с более открытой лицензией это сообщество, вероятно, будет расти дальше.

Как получить доступ к моделям Gemma 4

Где скачать и как попробовать

Все четыре модели уже доступны для загрузки – как базовые версии, так и версии с предварительной настройкой под диалог. Веса опубликованы на нескольких крупных платформах для работы с ИИ-моделями, а также поддерживаются популярными инструментами для локального запуска. Базовые версии тоже открыты, что позволяет дообучать модели под конкретные задачи.

Технический отчёт с подробным описанием архитектуры и методологии на момент релиза опубликован не был – это остаётся открытым вопросом для тех, кто хочет разобраться в деталях.

В целом Gemma 4 выглядит как серьёзная заявка Google на то, чтобы занять заметное место в сегменте локального ИИ – там, где важны не только способности модели, но и то, насколько легко её развернуть, использовать и адаптировать под себя.

Оригинальное название: Ask Gemini to Interact with Your Email, Calendar, and More
Дата публикации: 8 апр 2026
Carnegie Mellon University ai.cmu.edu Американский исследовательский университет, один из мировых центров развития искусственного интеллекта, ведущий фундаментальные и прикладные исследования в области машинного обучения, робототехники и компьютерных наук.
Предыдущая статья Как ChatGPT учат говорить «нет»: безопасность, честность и авторские права внутри модели

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Google открыла доступ к семейству моделей Gemma 4 – от компактных версий для мобильных устройств до мощных систем, способных конкурировать с решениями вдвое крупнее.

Carnegie Mellon Universityai.cmu.edu 9 апр 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться