Опубликовано

Tencent выпустила Hunyuan Image 3.0: редактор изображений с текстовыми командами

Новая модель от Tencent позволяет редактировать и комбинировать изображения через простые текстовые инструкции в приложении Yuanbao.

Продукты
Источник события: Tencent Время чтения: 2 – 3 минуты

Tencent представила обновлённую версию своей генеративной модели – Hunyuan Image 3.0-Instruct. Если коротко: теперь это не просто генератор картинок из текста, а полноценный редактор изображений, управляемый обычными фразами.

Что умеет новая версия

Главное отличие Hunyuan Image 3.0 от предыдущих версий – возможность работать с готовыми изображениями. Модель понимает текстовые инструкции и применяет их к загруженным картинкам. Не нужно разбираться в слоях, масках или сложных настройках – достаточно написать, что вы хотите изменить.

Система поддерживает два основных сценария:

  • Редактирование отдельных изображений – можно заменить объекты, изменить стиль, убрать или добавить детали;
  • Объединение нескольких изображений в одно – модель умеет комбинировать элементы из разных картинок по вашему описанию.

Проще говоря, если раньше нужно было осваивать графические редакторы, чтобы, например, поменять фон на фотографии или соединить два снимка, то теперь это можно сделать через текстовую команду.

Где это можно попробовать

Модель уже доступна в приложении Yuanbao – это ИИ-ассистент от Tencent. Там она работает как встроенный инструмент для обработки изображений. Пользователи могут загрузить свою картинку и задать инструкцию на естественном языке – что именно нужно изменить или как скомбинировать несколько изображений.

Такой подход делает редактирование изображений доступнее для людей без опыта в дизайне или обработке фото. Не нужно учиться пользоваться Photoshop или аналогичными программами – достаточно сформулировать задачу словами.

Контекст и направление развития

Hunyuan – это серия моделей искусственного интеллекта от Tencent, которая включает системы для генерации текста, изображений и видео. Компания развивает эти технологии в рамках своей экосистемы, интегрируя их в популярные сервисы вроде WeChat и Yuanbao.

Переход от простой генерации изображений к их редактированию через текстовые команды – логичный шаг. Это расширяет применимость моделей: теперь их можно использовать не только для создания новых картинок с нуля, но и для быстрой обработки существующих материалов.

Для пользователей это означает возможность решать повседневные задачи без специальных навыков: подправить фото, убрать лишний объект, изменить композицию или создать коллаж из нескольких снимков. Всё это – через обычный диалог с ИИ.

Что остаётся неясным

Пока нет подробностей о технических ограничениях модели. Например, насколько точно она понимает сложные многоступенчатые инструкции или как справляется с задачами, требующими тонкой настройки деталей. Также неизвестно, будет ли Hunyuan Image 3.0-Instruct доступна через API для разработчиков или останется только внутри экосистемы Tencent.

Кроме того, остаются вопросы о качестве результатов при работе с разными типами изображений – портретами, пейзажами, сложными композициями. Обычно такие модели хорошо работают на простых задачах, но могут давать артефакты или неточности при более требовательных запросах.

Тем не менее, сам факт появления подобного инструмента показывает, как меняется подход к редактированию изображений: от технических операций к простым текстовым командам. 📱

Ссылка на публикацию: https://mp.weixin.qq.com/s/hzgmBrBCN9wkV6KOAV4_Fg
Оригинальное название: 混元图像3.0图生图模型上线元宝:一句话就能p图
Дата публикации: 25 янв 2026
Tencenthunyuan.tencent.com Китайский технологический холдинг, развивающий ИИ для социальных платформ, игр, облака и цифровых сервисов.
Предыдущая статья Обновление Play: дубляж с помощью ИИ и улучшенный интерфейс Следующая статья MareNostrum 5 получит ИИ-ускорение: новый контракт на расширение европейского суперкомпьютера

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

ИИ: События

Вам может быть интересно

Перейти ко всем событиям

Другие события из мира искусственного интеллекта, которые помогают увидеть общую картину и понять, как меняется направление развития технологий.

Компания AMD представила Micro-World – первые модели мира (world models) с открытым исходным кодом. Они способны генерировать видео с учетом действий пользователя в реальном времени и оптимизированы для работы на графических процессорах компании.

Hugging Face запустил Community Evals – платформу, на которой разработчики могут самостоятельно тестировать языковые модели и делиться результатами, не полагаясь на закрытые рейтинги.

Команда Perplexity AI продемонстрировала, как технология прямой передачи данных между серверами помогает языковым моделям работать быстрее и эффективнее, устраняя «узкие места» в сетевой инфраструктуре.

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться