Опубликовано 11 февраля 2026

ElevenLabs добавила экспрессию голосовым агентам

Разработчики ElevenLabs выпустили режим Expressive для голосовых агентов, чтобы их речь звучала естественнее в диалогах с клиентами.

Продукты 3 – 4 минуты чтения
Источник события: ElevenLabs 3 – 4 минуты чтения

ElevenLabs запустила новый режим для своей платформы голосовых агентов – Expressive Mode. Если коротко, он делает искусственный голос более живым и естественным в разговорах.

Особенности и возможности режима Expressive Mode

Что именно изменилось

Раньше голосовые агенты ElevenLabs могли звучать немного однообразно – как будто читают текст, а не разговаривают. Теперь в режиме Expressive они могут передавать интонации, паузы и эмоциональные оттенки, свойственные обычной человеческой речи.

Речь идёт не о драматической игре или театральности, а о базовой естественности. Агент может звучать более заинтересованно, когда задаёт вопрос, или спокойнее, когда объясняет что-то сложное. Это тот уровень выразительности, который помогает не раздражаться во время телефонного разговора с автоматизированной системой.

Применение выразительной озвучки в бизнес задачах

Зачем это нужно в реальных сценариях

ElevenLabs позиционирует режим как решение для бизнес-задач: звонков в поддержку, продаж и консультаций. В таких ситуациях важно не только передать информацию, но и не вызвать у человека на другом конце провода ощущение, что с ним общается робот из 2010 года.

Проще говоря, если клиент звонит с проблемой, а агент отвечает с правильной интонацией – не механически, но и не наигранно весело – разговор проходит легче. Это не гарантирует решения проблемы, но снижает уровень раздражения от самого процесса общения.

Сложности анализа контекста при генерации живой речи

Технически это сложно?

Создать выразительную речь сложнее, чем просто озвучить текст. Модели нужно понимать контекст: что именно говорится, в какой момент диалога и какой тон уместен. Это не просто добавление пауз или изменение высоты голоса – это комплексная задача, требующая анализа всей беседы.

ElevenLabs не раскрывает подробностей того, как именно работает режим изнутри. Но суть в том, что система теперь умеет адаптировать голос к ситуации, а не просто произносить заготовленные фразы одним и тем же способом.

Сферы применения новых голосовых агентов ElevenLabs

Для кого это актуально

В первую очередь – для компаний, которые активно используют голосовых агентов в клиентском сервисе. Банки, интернет-магазины, колл-центры, сервисы доставки – везде, где автоматизация уже работает, но качество диалога всё ещё оставляет желать лучшего.

Если вы когда-нибудь звонили в поддержку и слышали механический голос, зачитывающий варианты меню без единой интонации, вы понимаете проблему. Expressive Mode пытается её решить.

Влияние естественной озвучки на рынок автоматизации

Что это значит для индустрии

Голосовые агенты становятся всё более распространёнными, и вопрос уже не в том, будут ли они использоваться, а в том, насколько комфортно будет с ними общаться. Появление режимов вроде Expressive показывает, что фокус смещается с чисто функциональной задачи – ответить на вопрос – к более комплексной: сделать это так, чтобы человек не чувствовал дискомфорта.

Это не значит, что голосовые агенты заменят живых операторов во всех сферах. Но в тех случаях, где автоматизация уже применяется, качество взаимодействия может заметно вырасти.

Риски и перспективы использования эмоционального ИИ

Остаётся вопрос

Насколько хорошо это работает на практике – покажет время. Одно дело – заявить о выразительности, другое – реализовать её так, чтобы она не звучала фальшиво или неуместно. Если агент начнёт выражать эмоции там, где это не нужно, или делать это слишком явно, эффект может быть обратным.

Пока ElevenLabs предлагает инструмент. Как его будут использовать компании и как на это отреагируют пользователи – это уже следующий этап.

Ссылка на публикацию: https://elevenlabs.io/blog/introducing-expressive-mode
Оригинальное название: Introducing Expressive Mode for ElevenAgents
Дата публикации: 11 фев 2026
ElevenLabs elevenlabs.io Американская компания, создающая ИИ-системы синтеза и клонирования речи.
Предыдущая статья Runway привлекла $450 млн на развитие генеративного видео Следующая статья LightOn выпустила NextPlaid – базу данных для быстрого поиска информации в ИИ-приложениях

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Mistral AI представила Voxtral – модель для расшифровки речи в реальном времени с точным разделением спикеров и новой интерактивной «песочницей» для работы с аудио.

Mistral AImistral.ai 6 фев 2026

Разработчик из Бангалора выпустил мультимодальную модель, которая понимает речь, текст и изображения, поддерживает основные языки Индии и способна работать в автономном режиме.

Sarvamwww.sarvam.ai 11 фев 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Gemini 3 Flash Preview Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 3 Flash Preview Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться