Опубликовано 9 апреля 2026

Google Gemma 4: новые ИИ-модели, которые работают на смартфонах

Google Gemma 4: открытые ИИ-модели, которые умещаются в смартфон

Google выпустила семейство открытых моделей Gemma 4 – от компактных версий для смартфонов до мощных решений для ПК, способных конкурировать с системами в разы крупнее.

Продукты 4 – 5 минут чтения

Источник события: Carnegie Mellon University 4 – 5 минут чтения

Если следить за развитием рынка открытых ИИ-моделей, то выход Google Gemma 4 – заметное событие. Не потому что это «революция» (это слово давно обесценилось в контексте ИИ), а потому что происходит нечто конкретное: большие возможности начинают умещаться в очень маленькие устройства.

Семейство моделей Google Gemma 4

Четыре модели вместо одной

Gemma 4 – это не одна модель, а целое семейство из четырёх вариантов, рассчитанных на разные устройства и задачи. Если коротко: два компактных варианта предназначены для смартфонов, два более крупных – для ПК и серверов.

Компактные версии, E2B и E4B, содержат 2 и 4 миллиарда параметров соответственно. Параметры – это, грубо говоря, «знания» модели: чем их больше, тем модель обычно умнее, но и тем больше ресурсов ей нужно. Google разрабатывала эти версии совместно с Qualcomm и MediaTek – производителями чипов, которые стоят во многих современных смартфонах. Цель конкретна: модели должны работать прямо на устройстве, без обращения к облаку, и при этом экономно расходовать память и заряд батареи.

Две старшие модели – 26B с архитектурой «смесь экспертов» и 31B Dense – рассчитаны на более мощное аппаратное обеспечение, но тоже умещаются на одном графическом процессоре. Это важно для тех, кто хочет запускать серьёзный ИИ локально, не арендуя облачные мощности.

Функциональные возможности Gemma 4

Что умеют эти модели

Все четыре варианта Gemma 4 умеют работать с текстом, изображениями и видео. Компактные версии E2B и E4B дополнительно понимают аудио – то есть могут распознавать речь прямо на устройстве, без интернета.

Контекстное окно у компактных моделей – до 128 тысяч токенов, у старших – до 256 тысяч. Токен – это примерно слово или его часть. Проще говоря, модели способны «держать в голове» очень длинные тексты или разговоры, не теряя нить.

Отдельно стоит отметить, что Gemma 4 изначально проектировалась для так называемых агентных сценариев – когда модель не просто отвечает на вопросы, а самостоятельно выполняет цепочки действий: вызывает инструменты, генерирует структурированные ответы, принимает решения на основе контекста. Это направление сейчас активно развивается в индустрии, и Gemma 4 встраивается в него нативно.

Все модели поддерживают более 140 языков. Русский – в их числе.

Производительность и рейтинги Gemma 4

Цифры, которые удивляют

Google утверждает, что добилась «беспрецедентного уровня интеллекта на один параметр» – и это не просто маркетинговая фраза. Старшая модель, 31B Dense, заняла третье место среди открытых моделей в независимом рейтинге Arena AI, обойдя при этом системы, которые в 20 раз больше по размеру. Модель на 26 миллиардов параметров заняла шестое место в том же рейтинге.

Для сравнения: 31 миллиард параметров – это не так уж и много по меркам современных флагманских моделей. Некоторые конкуренты оперируют сотнями миллиардов параметров. Тем не менее Gemma 4 31B уверенно конкурирует с ними, что говорит о заметном прогрессе в эффективности архитектуры.

Кроме того, Gemma 4 в целом превосходит предыдущее поколение – Gemma 3 – практически на всех стандартных тестах. Исключение составляет лишь самая маленькая версия E2B, которая в отдельных тестах немного уступает более крупной Gemma 3 27B. Что, в общем-то, логично: 2 миллиарда параметров против 27 миллиардов – разница в размере всё равно даёт о себе знать.

Значение локального ИИ и открытого кода Gemma 4

Почему это важно за пределами цифр

Запуск Gemma 4 – часть более широкой тенденции: ИИ постепенно перемещается с серверов на устройства. Это меняет то, как люди взаимодействуют с технологией.

Когда модель работает локально, данные никуда не уходят. Это актуально для тех, кто работает с чувствительной информацией или просто не хочет, чтобы его запросы обрабатывались на чужих серверах. Локальный запуск также означает работу без интернета, что открывает возможности для устройств в труднодоступных местах или в условиях нестабильного соединения.

Для разработчиков интерес ещё и в другом: Gemma 4 распространяется под лицензией Apache 2.0 – одной из самых либеральных в мире открытого программного обеспечения. Это значит, что модели можно использовать в коммерческих продуктах, модифицировать и встраивать в собственные решения практически без ограничений. Предыдущие версии Gemma выходили под собственной лицензией Google, которая накладывала дополнительные условия.

С момента появления первой Gemma разработчики скачали модели более 400 миллионов раз и создали свыше 100 тысяч производных вариантов. Gemma 4 строится на этом фундаменте, и с более открытой лицензией это сообщество, вероятно, будет расти дальше.

Как получить доступ к моделям Gemma 4

Где скачать и как попробовать

Все четыре модели уже доступны для загрузки – как базовые версии, так и версии с предварительной настройкой под диалог. Веса опубликованы на нескольких крупных платформах для работы с ИИ-моделями, а также поддерживаются популярными инструментами для локального запуска. Базовые версии тоже открыты, что позволяет дообучать модели под конкретные задачи.

Технический отчёт с подробным описанием архитектуры и методологии на момент релиза опубликован не был – это остаётся открытым вопросом для тех, кто хочет разобраться в деталях.

В целом Gemma 4 выглядит как серьёзная заявка Google на то, чтобы занять заметное место в сегменте локального ИИ – там, где важны не только способности модели, но и то, насколько легко её развернуть, использовать и адаптировать под себя.

#событие #технический контекст #нейросети #развитие ии #инфраструктура #открытые технологии #открытые языковые модели #ии в устройствах

Ссылка на публикацию: https://cmu.edu/ai-daily/news-and-events/2024/november/gemini-extensions.html

Оригинальное название: Ask Gemini to Interact with Your Email, Calendar, and More

Дата публикации: 8 апр 2026

Carnegie Mellon University ai.cmu.edu Американский исследовательский университет, один из мировых центров развития искусственного интеллекта, ведущий фундаментальные и прикладные исследования в области машинного обучения, робототехники и компьютерных наук.

Предыдущая статья Как ChatGPT учат говорить «нет»: безопасность, честность и авторские права внутри модели

Google Gemma 4: новые ИИ-модели, которые работают на смартфонах

Семейство моделей Google Gemma 4

Функциональные возможности Gemma 4

Производительность и рейтинги Gemma 4

Значение локального ИИ и открытого кода Gemma 4

Как получить доступ к моделям Gemma 4

Связанные публикации

Google выпустила Gemma 4: четыре модели с открытым кодом, помещающиеся на смартфоне

Google выпустила Gemma 4: открытые ИИ-модели, которые работают прямо на смартфоне

Gemma 4 от Google: что изменится для ИИ на устройствах?

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста