Alibaba представила Qwen3.5 – первую модель в семействе Qwen3, способную работать с текстом, изображениями и аудио изначально, без дополнительных адаптеров.
ИИ: События
ByteDance выпустила Dola-Seed-2.0-Preview – модель с длинным контекстом и продвинутым мышлением
Продукты
ByteDance представила новую языковую модель Dola-Seed-2.0-Preview, которая объединяет длинный контекст, расширенные аналитические способности и мультимодальность.
ИИ: События
Как AMD и Qwen выжали максимум из видеокарт MI300X
Технический контекст • Инфраструктура
Команда Qwen оптимизировала свои модели для работы на AMD MI300X, добившись задержки отклика до 15 мс на токен и полной генерации изображения за 0,4 секунды.
Alibaba выпустила Qwen-Image 2.0 – модель, которая генерирует изображения в 2K, работает с текстом и позволяет редактировать графику в рамках одного инструмента.
ИИ: События
Индийская компания Sarvam представила голосового ассистента Arya с поддержкой 10 языков
Продукты
Разработчик из Бангалора выпустил мультимодальную модель, которая понимает речь, текст и изображения, поддерживает основные языки Индии и способна работать в автономном режиме.
ИИ: События
В Copy.ai объяснили, как мультимодальность трансформирует работу отделов продаж и маркетинга
Бизнес
Компания Copy.ai рассказала, как совместное использование текста, данных и изображений позволяет объединить разрозненные рабочие процессы в единую эффективную экосистему.
Индийский стартап выпустил компактную мультимодальную модель, способную распознавать текст на 22 языках страны – зачастую точнее, чем глобальные аналоги.
Китайская компания Tencent выпускает в открытый доступ крупную мультимодальную модель, которая уже входит в топ-7 по редактированию изображений на LMArena.
LG AI Research рассказала о K-EXAONE – мультимодальной модели, созданной на собственной технологической базе и ориентированной на корейский язык и культурный контекст.