Опубликовано 8 апреля 2026

Google Gemma 4: открытые ИИ для смартфонов и мощных устройств

Google выпустила Gemma 4: открытые ИИ-модели, которые работают прямо на смартфоне

Google представила четвёртое поколение открытых моделей Gemma – от компактных версий для телефонов до мощных решений для серьёзных вычислительных задач.

Продукты 4 – 5 минут чтения
Источник события: PyTorch 4 – 5 минут чтения

Если следить за тем, как развивается рынок открытых ИИ-моделей, то последние несколько лет картина выглядела примерно так: крупные компании выпускают нечто мощное, но это «нечто» требует дорогого оборудования и работает только в облаке. Google с новой линейкой Gemma 4 пытается изменить этот баланс – и, судя по первым результатам, небезуспешно.

Что такое Google Gemma 4: новое поколение ИИ-моделей

Что вообще произошло

2 апреля Google DeepMind представила Gemma 4 – четвёртое поколение своей серии открытых языковых моделей. Это не одна модель, а целое семейство из четырёх вариантов, рассчитанных на разные задачи и устройства. Все они распространяются под лицензией Apache 2.0 – это означает, что их можно свободно использовать в коммерческих проектах без лишних ограничений.

В основе Gemma 4 лежат те же исследования и технологии, что и у Gemini 3 – флагманской закрытой модели Google. Проще говоря, открытая версия впитала в себя достижения закрытой.

Gemma 4: модели разных размеров для любых задач

Четыре размера для разных задач

Семейство делится на четыре модели:

  • E2B – самая компактная, около 2,3 млрд активных параметров. Работает на смартфоне или одноплатном компьютере, поддерживает аудиовход.
  • E4B – чуть крупнее, около 4,5 млрд активных параметров. Тоже рассчитана на работу на устройстве, в том числе на Android-телефонах.
  • 26B MoE – модель с архитектурой «смесь экспертов»: при 26 млрд параметров в общей сложности она реально задействует при работе лишь около 4 млрд. Это позволяет экономить вычислительные ресурсы без существенной потери качества.
  • 31B Dense – флагман семейства, 31 млрд параметров, все активны одновременно. Занимает третье место среди открытых моделей в международном рейтинге Arena AI Text.

Для работы двух старших моделей нужен мощный видеоускоритель – например, Nvidia H100. Компактные E2B и E4B разрабатывались в партнёрстве с Qualcomm и MediaTek и оптимизированы специально под мобильные процессоры: они экономно расходуют память и энергию.

Возможности Gemma 4: текст, аудио, изображения и видео

Не только текст: аудио, изображения и видео

Все четыре модели умеют работать не только с текстом, но и с изображениями и видео. Компактные E2B и E4B дополнительно поддерживают аудиовход – это открывает возможность распознавания речи прямо на устройстве, без отправки данных на сервер.

Важная техническая деталь, которая здесь имеет значение: модели умеют обрабатывать изображения с переменным соотношением сторон и гибко настраивать, сколько «внимания» уделять картинке. Это позволяет находить баланс между скоростью и качеством в зависимости от задачи – например, быстро обрабатывать низкое разрешение или тщательно анализировать детальное изображение.

Применение Gemma 4: для чего полезны новые ИИ-модели

Для чего это действительно полезно

Gemma 4 изначально проектировалась под агентные сценарии – это когда ИИ не просто отвечает на вопрос, а самостоятельно выполняет последовательность действий: вызывает инструменты, получает данные, принимает решения. Для этого модели нативно поддерживают структурированный вывод и вызов внешних функций.

Если коротко: это не просто чат-бот. Это основа для создания автономных помощников, которые могут, например, самостоятельно собирать информацию из разных источников и выдавать оформленный результат – без постоянного участия человека на каждом шагу.

Дополнительно модели показывают заметный прогресс в математических задачах и точном следовании инструкциям. Поддерживается более 140 языков, а контекстное окно у компактных версий – до 128 тысяч токенов, у старших – до 256 тысяч. Для сравнения: 128 тысяч токенов – это примерно несколько средних романов текстом.

Преимущества локальной работы ИИ-моделей на устройстве

Почему «на устройстве» – это важно

Большинство мощных ИИ-моделей работают в облаке: запрос уходит на сервер, там обрабатывается, возвращается ответ. Это удобно, но создаёт зависимость от интернета, добавляет задержку и поднимает вопросы приватности: данные покидают устройство.

Модели, работающие локально – прямо на смартфоне или ноутбуке, – лишены этих проблем. Они работают офлайн, реагируют быстро и не передают ничего наружу. Именно поэтому компактные варианты Gemma 4 интересны не только энтузиастам, но и корпоративным разработчикам, которым важен контроль над данными.

Старшие модели семейства, при всей своей мощности, помещаются на одном графическом ускорителе – это тоже выгодно отличает их от некоторых конкурентов, которым нужны целые кластеры.

Gemma 4 в экосистеме: широкое применение и развитие

Контекст: экосистема уже огромна

С момента выхода первого поколения Gemma разработчики скачали модели семейства более 400 миллионов раз и создали свыше 100 000 собственных модификаций на их основе. Это говорит о том, что Gemma – не просто технологическая демонстрация, а реально используемый инструмент в большом сообществе.

По словам исследователей Google DeepMind, команда целенаправленно работала над тем, чтобы максимизировать «интеллект на параметр» – то есть получить как можно более умную модель при минимальном размере. Судя по позициям в независимых рейтингах, это удалось: флагманская 31B конкурирует с моделями, которые в 20 раз больше по размеру.

Архитектурно Gemma 4 намеренно сделана совместимой с максимально широким спектром платформ и инструментов – это упрощает интеграцию и снижает порог входа для разработчиков. Модели также хорошо поддаются квантизации – процессу «сжатия», который позволяет запускать их на ещё более скромном железе с минимальной потерей качества.

В общем, Gemma 4 – это попытка Google дать разработчикам серьёзный инструмент, который не требует ни дорогой инфраструктуры, ни закрытого доступа. Получилось ли – покажет практика, но первые ориентиры выглядят убедительно.

Ссылка на публикацию: https://pytorch.org/blog/__trashed/
Оригинальное название: Generating State-of-the-Art GEMMs with TorchInductor's CuteDSL backend
Дата публикации: 7 апр 2026
PyTorch pytorch.org Международный проект и открытая платформа глубокого обучения, активно поддерживаемая исследовательским и разработческим сообществом для создания и внедрения ИИ-моделей.
Предыдущая статья Один показ – и всё: как новый подход к автоматизации учится у человека с первого раза Следующая статья Illustrious XL 3.5: когда генератор картинок начинает понимать язык как языковая модель

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Google DeepMind выпустила Gemma 4 – открытое семейство мультимодальных моделей, работающих с текстом, изображениями, видео и аудио непосредственно на устройстве.

Hugging Facehuggingface.co 3 апр 2026

ИИ: События

Gemma 4 на AMD: день в день с выходом модели

Технический контекст Инфраструктура

Google выпустила семейство открытых моделей Gemma 4, и AMD обеспечила их поддержку сразу в день релиза – на всём спектре своего оборудования, от дата-центров до ноутбуков.

AMDwww.amd.com 3 апр 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться