Тематика #мультимодальные модели

ИИ: События

Qwen3.5: первая модель с нативной мультимодальностью

Продукты

Alibaba представила Qwen3.5 – первую модель в семействе Qwen3, способную работать с текстом, изображениями и аудио изначально, без дополнительных адаптеров.

Alibaba Cloudwww.alibabacloud.com 17 фев 2026

ИИ: События

ByteDance выпустила Dola-Seed-2.0-Preview – модель с длинным контекстом и продвинутым мышлением

Продукты

ByteDance представила новую языковую модель Dola-Seed-2.0-Preview, которая объединяет длинный контекст, расширенные аналитические способности и мультимодальность.

ByteDanceseed.bytedance.com 16 фев 2026

ИИ: События

Как AMD и Qwen выжали максимум из видеокарт MI300X

Технический контекст • Инфраструктура

Команда Qwen оптимизировала свои модели для работы на AMD MI300X, добившись задержки отклика до 15 мс на токен и полной генерации изображения за 0,4 секунды.

LMSYS ORGlmsys.org 13 фев 2026

ИИ: События

Qwen-Image 2.0: когда нейросеть умеет и рисовать, и редактировать

Продукты

Alibaba выпустила Qwen-Image 2.0 – модель, которая генерирует изображения в 2K, работает с текстом и позволяет редактировать графику в рамках одного инструмента.

Alibaba Cloudwww.alibabacloud.com 12 фев 2026

ИИ: События

Индийская компания Sarvam представила голосового ассистента Arya с поддержкой 10 языков

Продукты

Разработчик из Бангалора выпустил мультимодальную модель, которая понимает речь, текст и изображения, поддерживает основные языки Индии и способна работать в автономном режиме.

Sarvamwww.sarvam.ai 11 фев 2026

ИИ: События

В Copy.ai объяснили, как мультимодальность трансформирует работу отделов продаж и маркетинга

Бизнес

Компания Copy.ai рассказала, как совместное использование текста, данных и изображений позволяет объединить разрозненные рабочие процессы в единую эффективную экосистему.

Copy AIwww.copy.ai 10 фев 2026

ИИ: События

Sarvam Vision: модель для работы с документами со знанием индийских языков

Продукты

Индийский стартап выпустил компактную мультимодальную модель, способную распознавать текст на 22 языках страны – зачастую точнее, чем глобальные аналоги.

Sarvamwww.sarvam.ai 9 фев 2026

ИИ: События

Tencent открывает модель Hunyuan с 80 млрд параметров: что это значит

Продукты

Китайская компания Tencent выпускает в открытый доступ крупную мультимодальную модель, которая уже входит в топ-7 по редактированию изображений на LMArena.

Tencenthunyuan.tencent.com 4 фев 2026

ИИ: События

K-EXAONE: как южнокорейская LG строит собственную большую языковую модель

Продукты

LG AI Research рассказала о K-EXAONE – мультимодальной модели, созданной на собственной технологической базе и ориентированной на корейский язык и культурный контекст.

LG AI Researchwww.lgresearch.ai 4 фев 2026