Опубликовано 9 апреля 2026

Google Gemma 4: открытые ИИ-модели для смартфонов и ПК

Google выпустила Gemma 4: четыре модели с открытым кодом, помещающиеся на смартфоне

Google открыла доступ к семейству моделей Gemma 4 – от компактных версий для мобильных устройств до мощных систем, способных конкурировать с решениями вдвое крупнее.

Продукты 4 – 5 минут чтения
Источник события: Carnegie Mellon University 4 – 5 минут чтения

Пока большинство продвинутых ИИ-моделей требуют мощных серверов и облачных подключений, Google двинулась в другом направлении. Семейство Gemma 4 – это четыре открытые модели, которые можно запускать локально: от смартфона до обычного персонального компьютера с одной видеокартой.

История и развитие Gemma

Откуда это всё взялось

Gemma – линейка открытых моделей Google, которая существует уже несколько поколений. Gemma 4 построена на технологиях, лежащих в основе Gemini 3 – проприетарной флагманской модели компании. Проще говоря, часть того, что раньше было доступно только через платные сервисы Google, теперь можно скачать и запустить самостоятельно.

С момента появления первого поколения Gemma разработчики загрузили модели семейства более 400 миллионов раз, а сообщество создало свыше 100 000 производных вариантов. Это достаточно весомый сигнал того, что открытые модели действительно используются – не только ради эксперимента, но и в реальных проектах.

Варианты моделей Gemma 4 и их применение

Четыре модели – четыре сценария использования

Семейство Gemma 4 включает модели разного размера, и это не просто градация «слабее – сильнее». Каждый вариант рассчитан на конкретный класс задач и оборудования.

E2B и E4B – самые компактные. Они разработаны в партнёрстве с Qualcomm и MediaTek и оптимизированы для запуска прямо на мобильных устройствах: смартфонах на Android, одноплатных компьютерах типа Raspberry Pi и подобных устройствах. Работают полностью офлайн – без подключения к интернету и без отправки данных на серверы. Оба поддерживают не только изображения и текст, но и аудиовход, то есть могут распознавать речь прямо на устройстве.

26B MoE – модель с архитектурой «смесь экспертов». Если коротко: несмотря на то что модель содержит 26 миллиардов параметров, при работе она одновременно задействует лишь около 4 миллиардов. Это позволяет ей работать быстрее и экономнее, чем можно было бы ожидать от такого размера. Для пользователя это означает меньшую нагрузку на железо при сопоставимом качестве.

31B Dense – старшая модель семейства, где все параметры активны одновременно. Именно она заняла третье место среди открытых моделей в международном рейтинге Arena AI. По данным Google, она конкурирует с системами, которые в 20 раз превосходят её по размеру.

Основные возможности всех моделей Gemma 4

Что умеют все четыре

Все модели семейства мультимодальны: они принимают на вход не только текст, но и изображения, видео с переменным разрешением. Компактные версии дополнительно поддерживают аудио. Это значит, что модель можно попросить описать изображение, расшифровать видеофрагмент или распознать речь – и всё это локально, без облака.

Контекстное окно – то есть объём информации, который модель может удерживать в «рабочей памяти» за один сеанс – составляет до 128 тысяч токенов у компактных версий и до 256 тысяч у старших. Для сравнения: 128 тысяч токенов – это примерно несколько сотен страниц текста.

Все четыре модели поддерживают более 140 языков, причём с учётом культурного контекста. Генерация кода, сложные логические задачи, многоэтапные рассуждения – всё это заявлено как базовые возможности, а не дополнительные надстройки.

Агентный режим работы ИИ

Агентный режим – это уже не эксперимент

Отдельного внимания заслуживает то, что Gemma 4 изначально проектировалась для так называемых агентных сценариев. Это когда модель не просто отвечает на вопросы, а самостоятельно планирует последовательность действий, взаимодействует с внешними инструментами и выполняет многошаговые задачи.

В отличие от предыдущих поколений, у Gemma 4 есть встроенная поддержка вызова функций и структурированного вывода данных. Проще говоря, модель может «общаться» с другими программами и сервисами по чётко заданным правилам – это базовое требование для построения автономных ИИ-агентов.

Преимущества открытой лицензии Apache 2.0

Открытая лицензия – и это важно

Предыдущие поколения Gemma распространялись под собственной лицензией Google с рядом ограничений. Gemma 4 выходит под лицензией Apache 2.0 – одной из самых свободных в мире открытого ПО. Это означает, что модели можно использовать в коммерческих продуктах, модифицировать и распространять практически без ограничений.

Для бизнеса это в первую очередь вопрос контроля: данные не покидают инфраструктуру компании, нет зависимости от внешних API, нет абонентской платы. Для разработчиков-энтузиастов – просто возможность взять и поэкспериментировать без юридических препятствий.

Значение Gemma 4 для обычных пользователей и индустрии

Почему это интересно за пределами профессиональной среды

Запуск сильной модели прямо на смартфоне – без отправки запросов куда-либо – это не только про скорость и приватность. Это про то, что ИИ перестаёт быть исключительно облачной услугой. Сценарии, которые раньше требовали подписки на дорогой сервис, теперь могут работать локально и бесплатно.

Насколько это реально в повседневном использовании – вопрос отдельный. Компактные модели хороши, но старшие версии по-прежнему требуют нормального железа. Тем не менее сам факт того, что модель с сотнями миллионов параметров помещается на одну видеокарту и работает без интернета, – это уже показательный сдвиг в том, куда движется индустрия.

Оригинальное название: New NSF Institute at CMU Will Help Mathematicians Harness AI and Advance Discoveries
Дата публикации: 8 апр 2026
Carnegie Mellon University ai.cmu.edu Американский исследовательский университет, один из мировых центров развития искусственного интеллекта, ведущий фундаментальные и прикладные исследования в области машинного обучения, робототехники и компьютерных наук.
Предыдущая статья Как PyTorch научился быстрее выполнять нормализацию и почему это важно для нейросетей Следующая статья Как ChatGPT учат говорить «нет»: безопасность, честность и авторские права внутри модели

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Google DeepMind выпустила Gemma 4 – открытое семейство мультимодальных моделей, работающих с текстом, изображениями, видео и аудио непосредственно на устройстве.

Hugging Facehuggingface.co 3 апр 2026

ИИ: События

Google Gemma 4 и NVIDIA: мощный ИИ прямо на вашем компьютере

Технический контекст Инфраструктура

Google выпустила новое семейство моделей Gemma, оптимизированных совместно с NVIDIA для локального запуска – от компактных Edge-устройств до мощных рабочих станций.

Nvidiablogs.nvidia.com 3 апр 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться