Опубликовано 8 апреля 2026

Google Gemma 4: открытые ИИ для смартфонов и мощных устройств

Google выпустила Gemma 4: открытые ИИ-модели, которые работают прямо на смартфоне

Google представила четвёртое поколение открытых моделей Gemma – от компактных версий для телефонов до мощных решений для серьёзных вычислительных задач.

Продукты 4 – 5 минут чтения
Источник события: PyTorch 4 – 5 минут чтения

Если следить за тем, как развивается рынок открытых ИИ-моделей, то последние несколько лет картина выглядела примерно так: крупные компании выпускают нечто мощное, но это «нечто» требует дорогого оборудования и работает только в облаке. Google с новой линейкой Gemma 4 пытается изменить этот баланс – и, судя по первым результатам, небезуспешно.

Что такое Google Gemma 4: новое поколение ИИ-моделей

Что вообще произошло

2 апреля Google DeepMind представила Gemma 4 – четвёртое поколение своей серии открытых языковых моделей. Это не одна модель, а целое семейство из четырёх вариантов, рассчитанных на разные задачи и устройства. Все они распространяются под лицензией Apache 2.0 – это означает, что их можно свободно использовать в коммерческих проектах без лишних ограничений.

В основе Gemma 4 лежат те же исследования и технологии, что и у Gemini 3 – флагманской закрытой модели Google. Проще говоря, открытая версия впитала в себя достижения закрытой.

Gemma 4: модели разных размеров для любых задач

Четыре размера для разных задач

Семейство делится на четыре модели:

  • E2B – самая компактная, около 2,3 млрд активных параметров. Работает на смартфоне или одноплатном компьютере, поддерживает аудиовход.
  • E4B – чуть крупнее, около 4,5 млрд активных параметров. Тоже рассчитана на работу на устройстве, в том числе на Android-телефонах.
  • 26B MoE – модель с архитектурой «смесь экспертов»: при 26 млрд параметров в общей сложности она реально задействует при работе лишь около 4 млрд. Это позволяет экономить вычислительные ресурсы без существенной потери качества.
  • 31B Dense – флагман семейства, 31 млрд параметров, все активны одновременно. Занимает третье место среди открытых моделей в международном рейтинге Arena AI Text.

Для работы двух старших моделей нужен мощный видеоускоритель – например, Nvidia H100. Компактные E2B и E4B разрабатывались в партнёрстве с Qualcomm и MediaTek и оптимизированы специально под мобильные процессоры: они экономно расходуют память и энергию.

Возможности Gemma 4: текст, аудио, изображения и видео

Не только текст: аудио, изображения и видео

Все четыре модели умеют работать не только с текстом, но и с изображениями и видео. Компактные E2B и E4B дополнительно поддерживают аудиовход – это открывает возможность распознавания речи прямо на устройстве, без отправки данных на сервер.

Важная техническая деталь, которая здесь имеет значение: модели умеют обрабатывать изображения с переменным соотношением сторон и гибко настраивать, сколько «внимания» уделять картинке. Это позволяет находить баланс между скоростью и качеством в зависимости от задачи – например, быстро обрабатывать низкое разрешение или тщательно анализировать детальное изображение.

Применение Gemma 4: для чего полезны новые ИИ-модели

Для чего это действительно полезно

Gemma 4 изначально проектировалась под агентные сценарии – это когда ИИ не просто отвечает на вопрос, а самостоятельно выполняет последовательность действий: вызывает инструменты, получает данные, принимает решения. Для этого модели нативно поддерживают структурированный вывод и вызов внешних функций.

Если коротко: это не просто чат-бот. Это основа для создания автономных помощников, которые могут, например, самостоятельно собирать информацию из разных источников и выдавать оформленный результат – без постоянного участия человека на каждом шагу.

Дополнительно модели показывают заметный прогресс в математических задачах и точном следовании инструкциям. Поддерживается более 140 языков, а контекстное окно у компактных версий – до 128 тысяч токенов, у старших – до 256 тысяч. Для сравнения: 128 тысяч токенов – это примерно несколько средних романов текстом.

Преимущества локальной работы ИИ-моделей на устройстве

Почему «на устройстве» – это важно

Большинство мощных ИИ-моделей работают в облаке: запрос уходит на сервер, там обрабатывается, возвращается ответ. Это удобно, но создаёт зависимость от интернета, добавляет задержку и поднимает вопросы приватности: данные покидают устройство.

Модели, работающие локально – прямо на смартфоне или ноутбуке, – лишены этих проблем. Они работают офлайн, реагируют быстро и не передают ничего наружу. Именно поэтому компактные варианты Gemma 4 интересны не только энтузиастам, но и корпоративным разработчикам, которым важен контроль над данными.

Старшие модели семейства, при всей своей мощности, помещаются на одном графическом ускорителе – это тоже выгодно отличает их от некоторых конкурентов, которым нужны целые кластеры.

Gemma 4 в экосистеме: широкое применение и развитие

Контекст: экосистема уже огромна

С момента выхода первого поколения Gemma разработчики скачали модели семейства более 400 миллионов раз и создали свыше 100 000 собственных модификаций на их основе. Это говорит о том, что Gemma – не просто технологическая демонстрация, а реально используемый инструмент в большом сообществе.

По словам исследователей Google DeepMind, команда целенаправленно работала над тем, чтобы максимизировать «интеллект на параметр» – то есть получить как можно более умную модель при минимальном размере. Судя по позициям в независимых рейтингах, это удалось: флагманская 31B конкурирует с моделями, которые в 20 раз больше по размеру.

Архитектурно Gemma 4 намеренно сделана совместимой с максимально широким спектром платформ и инструментов – это упрощает интеграцию и снижает порог входа для разработчиков. Модели также хорошо поддаются квантизации – процессу «сжатия», который позволяет запускать их на ещё более скромном железе с минимальной потерей качества.

В общем, Gemma 4 – это попытка Google дать разработчикам серьёзный инструмент, который не требует ни дорогой инфраструктуры, ни закрытого доступа. Получилось ли – покажет практика, но первые ориентиры выглядят убедительно.

Ссылка на публикацию: https://pytorch.org/blog/__trashed/
Оригинальное название: Generating State-of-the-Art GEMMs with TorchInductor's CuteDSL backend
Дата публикации: 7 апр 2026
PyTorch pytorch.org Международный проект и открытая платформа глубокого обучения, активно поддерживаемая исследовательским и разработческим сообществом для создания и внедрения ИИ-моделей.
Предыдущая статья Один показ – и всё: как новый подход к автоматизации учится у человека с первого раза Следующая статья Illustrious XL 3.5: когда генератор картинок начинает понимать язык как языковая модель

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Google DeepMind выпустила Gemma 4 – открытое семейство мультимодальных моделей, работающих с текстом, изображениями, видео и аудио непосредственно на устройстве.

Hugging Facehuggingface.co 3 апр 2026

ИИ: События

Gemma 4 на AMD: день в день с выходом модели

Технический контекст Инфраструктура

Google выпустила семейство открытых моделей Gemma 4, и AMD обеспечила их поддержку сразу в день релиза – на всём спектре своего оборудования, от дата-центров до ноутбуков.

AMDwww.amd.com 3 апр 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться