Опубликовано 10 февраля 2026

Инкрементальные вычисления в аналитике больших данных и их преимущества

Когда данных слишком много: как инкрементальные вычисления меняют подход к аналитике

Команда AnalyticDB представила StreamingView – движок для работы с постоянно обновляемыми данными, который исключает необходимость пересчитывать весь массив информации при каждом изменении.

Исследования 3 – 5 минут чтения
Источник события: Alibaba Cloud 3 – 5 минут чтения

Чем больше данных обрабатывают ИИ-системы, тем острее встаёт вопрос: как работать с информацией, которая постоянно меняется? Если каждый раз пересчитывать всё с нуля, процесс становится медленным и дорогим. Если же игнорировать обновления – результаты быстро устаревают.

Исследователи из команды AnalyticDB for PostgreSQL предложили решение этой проблемы и описали его в статье для конференции VLDB. Речь идёт о технологии StreamingView – встроенном движке инкрементальных вычислений, который позволяет обновлять аналитические результаты постепенно, по мере поступления новых данных, а не перестраивать их целиком.

Что такое инкрементальные вычисления и зачем они нужны

Представьте, что вы ведёте таблицу с продажами интернет-магазина. Каждую минуту в неё добавляются новые заказы. Вам нужно видеть актуальную статистику: сколько товаров продано за день, какова выручка по категориям и какие регионы лидируют.

Классический подход – каждый раз пересчитывать всю таблицу заново. Но если в ней миллионы строк, это занимает много времени и требует значительных вычислительных ресурсов. Инкрементальный подход работает иначе: система запоминает предыдущий результат и обновляет только ту его часть, которая изменилась. Пришёл новый заказ – он добавился к итогу. Один заказ отменили – сумма уменьшилась.

Звучит логично, но реализовать это на практике – особенно для сложных запросов с фильтрами, группировками и объединениями таблиц – непросто.

Материализованные представления и инкрементальное обновление данных

Материализованные представления: когда скорость важнее свежести

В базах данных есть понятие материализованного представления. Это заранее вычисленный результат запроса, который хранится как отдельная таблица. Вместо того чтобы каждый раз выполнять сложный запрос, система просто возвращает готовый ответ – это происходит мгновенно.

Проблема в том, что если исходные данные изменились, материализованное представление нужно обновить. И здесь начинаются сложности. Традиционные системы либо обновляют такие представления по расписанию (например, раз в час), либо пересчитывают их полностью при каждом изменении. Первый вариант выдаёт устаревшие данные, второй – слишком медленный и ресурсоёмкий.

StreamingView предлагает третий путь: обновлять материализованные представления инкрементально и делать это в режиме реального времени.

Принципы работы технологии StreamingView в AnalyticDB

Как это работает внутри AnalyticDB

StreamingView встроен напрямую в AnalyticDB for PostgreSQL. Это означает, что он работает с данными там же, где они хранятся, без необходимости переносить их в отдельную систему обработки. Это критически важно, так как перемещение больших объёмов информации между системами – одна из главных причин задержек в аналитике.

Движок отслеживает изменения в исходных таблицах и постепенно применяет их к материализованным представлениям. Если добавилась новая строка – она учитывается в итоговом результате. Если строка удалена или изменена – корректировка происходит без полного пересчёта.

При этом система умеет работать со сложными SQL-запросами, включающими несколько таблиц, агрегации и фильтры. То есть инкрементальность применяется не только к простым суммам, но и к запросам, которые в обычных условиях требуют тяжеловесных вычислений.

Роль инкрементальных вычислений в обработке данных для ИИ

Зачем это нужно в эпоху ИИ

ИИ-системы оперируют огромными массивами данных, которые постоянно пополняются. Логи пользователей, события в приложениях, данные с датчиков, обновления каталогов – всё это требует быстрого и актуального анализа.

Классическая аналитика строилась на предположении, что данные относительно статичны: загрузили, обработали, получили отчёт. Но современные приложения генерируют информацию непрерывно. И если каждый раз заново пересчитывать аналитические дашборды или обучающие датасеты для моделей, система просто не будет успевать за потоком.

Инкрементальные вычисления решают эту проблему: они позволяют поддерживать актуальность результатов без лишних затрат ресурсов. В контексте ИИ это особенно важно, поскольку модели часто требуют свежих данных для переобучения или валидации, а задержки в их получении могут снижать точность прогнозов.

Перспективы развития технологий инкрементальных вычислений

Что дальше

StreamingView – не единственная попытка внедрить инкрементальные вычисления, но она интересна тем, что технология работает внутри самой базы данных, а не требует отдельной инфраструктуры. Это упрощает архитектуру и снижает накладные расходы на передачу данных.

Публикация на VLDB – это академическое признание подхода, однако востребованность решения на практике покажет время. Инкрементальные вычисления – это всегда компромисс между точностью, скоростью и сложностью реализации. Они эффективны там, где данные меняются часто, но предсказуемо. Если же изменения хаотичны или затрагивают большую часть данных, выигрыш может быть не столь заметным.

Тем не менее направление активно развивается. И чем больше данных будет обрабатывать ИИ, тем актуальнее будет становиться вопрос: как делать это не просто быстро, но и максимально эффективно.

#аналитика #технический контекст #инженерия #компьютерные системы #инфраструктура #данные #инкрементальные вычисления #обработка потоковых данных
Оригинальное название: VLDB Paper Deep Dive: As AI Advances, Data Analysis Enters the Era of Incremental Computation
Дата публикации: 10 фев 2026
Alibaba Cloud www.alibabacloud.com Китайское облачное и ИИ-подразделение Alibaba, предоставляющее инфраструктуру и сервисы для бизнеса.
Предыдущая статья Microsoft и Cognizant внедряют агентный ИИ в страховой бизнес Следующая статья Oracle встраивает ИИ-агентов в систему управления цепочками поставок

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

ИИ: События

Почему автономному ИИ нужна платформа данных, а не просто большая модель

Технический контекст Инфраструктура

AMD объясняет, почему настоящая автономность ИИ начинается не с алгоритмов, а с грамотной стратегии работы с данными и единой платформы для их использования.

AMDwww.amd.com 6 фев 2026

Опрос руководителей IT-подразделений показал, что в 2026 году фокус мониторинга смещается на генеративный ИИ и стандарт OpenTelemetry. Разбираемся, как эти технологии упрощают анализ сложных систем и избавляют инженеров от рутины.

Elasticwww.elastic.co 10 фев 2026

Радиотелескопы генерируют петабайты данных, но что, если большую часть можно предсказать математически? История о том, как сжать космические сигналы без потерь.

Доктор Даниэль Штерн 4 янв 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Gemini 3 Flash Preview Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 3 Flash Preview Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться