Опубликовано 27 апреля 2026

Выборочная энтропия для графовых сигналов: измерение хаоса в сетях

Как измерить хаос в сети: выборочная энтропия для графовых сигналов

Исследователи придумали, как оценить сложность и непредсказуемость сигналов в сетях – от нейронных связей до социальных графов – с помощью обобщённой энтропии.

Электротехника и системные науки 9 – 13 минут чтения
Автор публикации: Доктор Анна Мюллер 9 – 13 минут чтения
«Меня в этой работе больше всего занимает не сам метод, а то, что за ним стоит: осознание того, что инструменты анализа должны соответствовать структуре данных, а не наоборот. Мы слишком долго «выпрямляли» сетевые данные в последовательности – потому что умели с ними работать. SampEnG – это честная попытка перестать так делать. Интересно будет увидеть, как метод поведёт себя на реальных инфраструктурных данных, где топология сети далека от учебных примеров.» – Доктор Анна Мюллер

Что такое нерегулярность и зачем её измерять

Что такое «нерегулярность» и зачем её измерять

Представьте, что вы слушаете сердцебиение. Врач не просто считает удары в минуту – он обращает внимание на ритм: насколько равномерны промежутки между ударами, есть ли в них скрытый порядок или, напротив, хаос. Именно для этого в 2000 году Ричман и Мурман разработали метод под названием выборочная энтропия (Sample Entropy, или SampEn) – инструмент, позволяющий формально описать, насколько «непредсказуем» сигнал во времени.

Принцип работает так: берётся временной ряд, из него вырезаются короткие «шаблоны» заданной длины m, а затем подсчитывается, как часто два похожих шаблона остаются похожими при увеличении их длины до m+1. Если такое «продолжение сходства» случается редко – сигнал хаотичен, его энтропия высока. Если похожие шаблоны регулярно повторяются – сигнал упорядочен, энтропия низка. Метод элегантен, хорошо изучен и применяется в кардиологии, нейрофизиологии, климатологии – везде, где нужно понять степень «организованности» данных.

Но у него есть принципиальное ограничение: он работает только с линейными последовательностями. Одна точка следует за другой, как вагоны в поезде. Что если данные устроены иначе – не в виде цепочки, а в виде сети?

Графы как основа для анализа данных

Когда данные живут на графах

Возьмём несколько примеров из реального мира. Мозг – это не просто набор нейронов, активирующихся один за другим. Это плотная сеть связей, где каждый участок влияет на множество других одновременно. Социальная сеть – это тоже не очередь: одно сообщение может распространяться сразу в сотни узлов, и скорость его распространения зависит от структуры связей. Энергосистема – переплетение станций, подстанций и линий передачи, где нагрузка перераспределяется нелинейно.

Во всех этих случаях данные существуют не на прямой временной оси, а на графе – математической структуре, состоящей из узлов (вершин) и связей между ними (рёбер). Каждому узлу можно присвоить числовое значение – это и будет «графовый сигнал». Температура на метеостанциях, соединённых маршрутами передачи данных. Активность нейронов в сети мозга. Уровень трафика в узлах интернет-провайдера.

Область обработки графовых сигналов (Graph Signal Processing, GSP) занимается именно такими данными. Она заимствует идеи из классической теории сигналов – фильтрацию, преобразования, частотный анализ – и адаптирует их к нерегулярной структуре графов. Ключевой элемент здесь – так называемый оператор сдвига графа (Graph Shift Operator, GSO). По аналогии с тем, как сдвиг во времени позволяет «передвигаться» по временному ряду, оператор сдвига графа позволяет «передвигаться» по сети: переходить от узла к его соседям, агрегировать информацию из окружения.

Именно здесь и возникает вопрос, который поставили перед собой авторы рассматриваемого исследования: можно ли измерить «хаотичность» или «нерегулярность» графового сигнала так же, как выборочная энтропия измеряет её для временного ряда?

Как адаптировать выборочную энтропию к графам

Идея: заменить время на соседей

Ответ, предложенный в работе, – обобщение выборочной энтропии на графовые сигналы, обозначенное как SampEnG. Ключевая идея проста по своей сути, хотя математически требует аккуратности.

В классическом SampEn шаблон для точки i формируется из последовательных значений временного ряда: берётся сама точка, затем следующая, потом следующая – всего m элементов. Это называется «вложением с задержкой»: мы смотрим, что было до и что будет после.

В SampEnG вместо «соседей во времени» используются соседи в графе. Для каждого узла i строится шаблон следующим образом:

  • Нулевой элемент шаблона – это само значение сигнала в узле i.
  • Первый элемент – это среднее значение сигнала по непосредственным соседям узла i (то есть то, что «видит» узел на расстоянии одного шага по графу).
  • Второй элемент – среднее по соседям соседей (два шага по графу).
  • И так далее, до m−1 шагов.

Технически это реализуется через последовательное применение оператора сдвига графа к исходному сигналу. Если обозначить оператор как SG, то значение на k-м шаге вычисляется как SGkx, где x – исходный сигнал. Таким образом, для каждого узла формируется вектор из m чисел, описывающий, как сигнал распределён в его локальном окружении на разных «расстояниях» по сети.

После того как такие шаблоны построены для всех узлов, дальнейшие вычисления полностью повторяют логику классического SampEn: считаем, как часто два шаблона длины m «похожи» (отличаются друг от друга не более чем на порог r), и проверяем, сохраняется ли это сходство при добавлении ещё одного элемента. Результат – логарифм отношения этих двух количеств, взятый с отрицательным знаком.

Проверка работы SampEnG на простом случае

Проверка: работает ли это на простом случае?

Первое, что стоит проверить для любого нового метода, – не противоречит ли он уже известным результатам. Авторы взяли простейший граф: ориентированную цепочку узлов, где каждый узел соединён только со следующим. Это, по сути, математическая запись обычной временной последовательности на языке теории графов.

Применение SampEnG к такому графу даёт в точности тот же результат, что и классический SampEn для соответствующего временного ряда. Это не случайность: если каждый узел «смотрит» только на следующий по цепочке, то «соседи в графе» – это именно «соседи во времени». Формальное доказательство этого факта показывает, что SampEnG является корректным обобщением: он не «изобретает новый метод», а расширяет существующий на более широкий класс структур.

Тестирование чувствительности SampEnG к хаосу

Чувствительность к хаосу: тест с логистическим отображением

Следующий шаг – убедиться, что метод чувствителен к нелинейной динамике. Для этого авторы воспользовались классическим инструментом из теории динамических систем – логистическим отображением.

Это простая формула: xt+1 = R · xt · (1 − xt). При разных значениях параметра R она генерирует принципиально разные режимы поведения:

  • При малых значениях R система быстро приходит к устойчивому состоянию – все значения стремятся к одной точке. Это максимально «скучный» сигнал.
  • При значениях R около 3 система начинает колебаться между двумя точками, затем между четырьмя, восьмью – это так называемые «бифуркации».
  • При значениях R близких к 4 система переходит в хаотический режим: значения скачут непредсказуемо, и никакой закономерности не прослеживается.

SampEnG показал именно то поведение, которого следовало ожидать: низкие значения для регулярных режимов, резкие всплески в точках бифуркаций и устойчиво высокие значения в хаотической области. Это подтверждает, что метод действительно улавливает нелинейную «сложность» сигнала, а не реагирует на случайные флуктуации.

Эксперименты с SampEnG на случайных сетевых структурах

Эксперименты на случайных сетях

Для изучения поведения SampEnG на более реалистичных сетевых структурах авторы использовали модель случайных ориентированных графов Эрдёша–Реньи. В этой модели граф с N узлами строится следующим образом: каждая возможная пара узлов соединяется направленным ребром с некоторой фиксированной вероятностью p. Изменяя p, можно плавно регулировать «плотность» сети – от почти пустого графа до почти полностью связного.

На таких графах авторы генерировали сигналы с помощью логистического отображения и исследовали, как SampEnG реагирует на изменения параметров. Наблюдения оказались содержательными:

  1. Влияние параметра R логистического отображения. Поведение SampEnG полностью повторяло ожидаемую картину: высокая энтропия для хаотических режимов, низкая – для регулярных. Это хороший знак: метод «видит» динамику сигнала даже на нерегулярной сетевой структуре.
  2. Влияние плотности связей. Здесь проявился интересный эффект: чем выше вероятность p (то есть чем больше у каждого узла соседей), тем ниже значение SampEnG. Объяснение интуитивно понятно: когда у узла много соседей, его локальный шаблон усредняет сигналы по большому числу связей, и разнообразие шаблонов снижается – как если бы вы смотрели не на отдельные пиксели, а на сильно размытое изображение. Высокосвязная сеть как бы «сглаживает» хаос.
  3. Влияние длины шаблона m. Как и в классическом SampEn, увеличение длины шаблона снижает итоговое значение энтропии – длинные шаблоны встречаются реже и реже совпадают. Авторы рекомендуют придерживаться стандартных значений m равных 2 или 3, что согласуется с практикой применения классической выборочной энтропии.

Практичность и вычислительная скорость метода SampEnG

Вопрос скорости: насколько это практично

Любой аналитический инструмент, каким бы элегантным он ни был, должен работать за разумное время. Вычислительная сложность SampEnG складывается из двух частей. Первая – построение шаблонов: это операции с оператором сдвига, которые для разреженных графов занимают время, пропорциональное произведению m на количество узлов и рёбер. Вторая – подсчёт похожих пар шаблонов, который растёт как квадрат от числа узлов.

Итоговая сложность: O(m(N+E) + N2). На практике для графов с несколькими тысячами узлов вычисления укладываются в приемлемое время. Это делает метод реально применимым для задач умеренного масштаба – анализа нейронных сетей на основе данных МРТ, мониторинга небольших коммуникационных сетей, изучения региональных климатических данных.

Конечно, для графов с миллионами узлов потребуются либо аппроксимации, либо параллельные вычисления – это честно признаётся в работе и обозначается как направление для дальнейшего развития метода.

Применение выборочной энтропии для графовых сигналов

Где это может пригодиться

Авторы намеренно не ограничивают область применения SampEnG одной дисциплиной. Инструмент, по существу, универсален для любых данных, которые можно представить в виде сигнала на графе. Несколько конкретных направлений заслуживают отдельного упоминания.

Нейронауки. Мозг – это именно та область, где сетевой анализ оказывается незаменимым. Данные функциональной МРТ или ЭЭГ часто интерпретируются как сигналы на графе функциональных связей между отделами мозга. Выборочная энтропия в классическом виде уже применяется для оценки сложности мозговой активности при различных состояниях (сон, бодрствование, патологические состояния). SampEnG потенциально позволяет делать это с учётом топологии нейронных сетей, а не только для изолированных сигналов.

Мониторинг инфраструктурных сетей. В энергетике, телекоммуникациях и транспорте данные о состоянии сети – это именно графовые сигналы. Аномальное поведение (отказ оборудования, перегрузка узла, нетипичный трафик) можно охарактеризовать через изменение энтропии. Метрика, учитывающая структуру связей, потенциально более чувствительна к локализованным аномалиям, чем глобальные статистики.

Климатология. Метеостанции, климатические модели, данные со спутников – всё это можно представить как сигналы на географическом графе. Оценка нерегулярности климатических переменных с учётом пространственных связей между регионами открывает возможности для более точного описания климатических режимов.

Социальные сети и информационные каскады. Распространение информации в социальных сетях следует сетевой логике: одна публикация может быть переадресована сотнями узлов одновременно. Измерение «хаотичности» этого распространения с учётом топологии сети – задача, для которой SampEnG выглядит как естественный инструмент.

Дальнейшие шаги в развитии метода SampEnG

Что ещё предстоит сделать

Работа честно обозначает границы того, что уже сделано, и того, что остаётся открытым. Эмпирическая валидация проведена на синтетических данных – это необходимый первый шаг, но не последний. Для того чтобы SampEnG стал надёжным инструментом в прикладных исследованиях, необходимо следующее.

  • Теоретический анализ устойчивости метода: как он ведёт себя при малых возмущениях структуры графа или сигнала.
  • Сравнение с другими подходами к измерению нерегулярности на графах, в том числе с методами, основанными на символьной динамике.
  • Исследование влияния выбора оператора сдвига: разные GSO дают разные результаты, и пока нет систематического понимания того, как выбирать оператор под конкретную задачу.
  • Расширение на динамические графы, где структура сети меняется со временем – это особенно актуально для задач мониторинга в реальном времени.
  • Тестирование на реальных наборах данных из нейронаук, климатологии и инфраструктурного мониторинга.

Каждый из этих пунктов – не просто академический интерес. Это конкретные шаги, без которых метод останется лабораторным прототипом, а не рабочим инструментом.

Преимущества учета структуры данных в анализе

Почему это важно – если говорить прямо

Большинство инструментов для анализа временных рядов создавались в эпоху, когда «данные» означали «одна последовательность чисел». Физиологический сигнал, биржевой курс, показания датчика – всё это укладывалось в одномерную цепочку. Выборочная энтропия была создана именно для этой парадигмы, и она прекрасно в ней работает.

Но реальные системы сложнее. Они состоят из взаимодействующих компонентов, и связи между этими компонентами несут информацию не меньшую, чем сами значения в узлах. Игнорировать эту топологию при анализе – это всё равно что изучать электрическую схему, смотря только на напряжение в одной точке и не зная, как соединены остальные элементы.

SampEnG – это попытка сделать шаг в сторону анализа, который учитывает структуру. Не революция, а методичное расширение хорошо зарекомендовавшего себя инструмента на новый класс задач. Именно так, как правило, и развивается хорошая инженерная наука: не через громкие прорывы, а через последовательное устранение ограничений существующих методов.

Посмотрим, насколько широко эта идея приживётся на практике – первые результаты дают для этого достаточно оснований.

Оригинальное название: Sample entropy for graph signals: An approach to nonlinear analysis of graph signals
Дата публикации статьи: 22 апр 2026
Авторы оригинальной статьи : Mei-San Maggie Lei, John Stewart Fabila Carrasco, Javier Escudero
Предыдущая статья Ленточные мосты между мирами: как геометрия связывает пространства разных измерений Следующая статья Когда цифры лгут: как методология превращает катастрофу в «скромный эффект»

Связанные публикации

Вам может быть интересно

Войти в Лабораторию

Исследование не заканчивается одним экспериментом. Ниже – публикации, которые развивают похожие методы, вопросы или концепции.

Учёные разработали новый метод моделирования, позволяющий точнее измерять сигналы от частиц тёмной материи в полупроводниковых детекторах на уровне единичных квантов.

Профессор Оливер Харрис 25 мар 2026

Что происходит с квантовой неопределённостью, когда рядом чёрная дыра? Новое исследование показывает, что гравитация буквально переписывает правила квантового мира.

Доктор Элис Ворт 14 апр 2026

Исследователи предложили новый способ измерять неуверенность ИИ-моделей – через «пробелы в признаках», которые помогают точнее понять, когда модели не стоит доверять.

Capital Onewww.capitalone.com 14 мар 2026

От исследования к пониманию

Как создавался этот текст

Этот материал основан на реальном научном исследовании, а не сгенерирован «с нуля». В начале работы нейросети анализируют исходную публикацию: её цели, методы и выводы. Затем автор формирует связный текст, который сохраняет научный смысл, но переводит его из академического формата в ясное и читаемое изложение – без формул, но без потери точности.

Научная строгость

81%

Оптимизм

72%

Техническая глубина

89%

Нейросети, участвовавшие в работе

Мы показываем, какие модели использовались на каждом этапе – от анализа исследования до редакторской проверки и создания иллюстрации. Каждая нейросеть выполняет свою роль: одни работают с источником, другие – с формулировками и структурой, третьи – с визуальным образом. Это позволяет сохранить прозрачность процесса и доверие к результату.

1.
Gemini 2.5 Flash Google DeepMind Резюмирование исследования Выделение ключевых идей и результатов

1. Резюмирование исследования

Выделение ключевых идей и результатов

Gemini 2.5 Flash Google DeepMind
2.
Claude Sonnet 4.6 Anthropic Создание текста на основе резюме Преобразование резюме в связное объяснение

2. Создание текста на основе резюме

Преобразование резюме в связное объяснение

Claude Sonnet 4.6 Anthropic
3.
Gemini 2.5 Flash Google DeepMind Редакторская проверка Исправление ошибок и уточнение выводов

3. Редакторская проверка

Исправление ошибок и уточнение выводов

Gemini 2.5 Flash Google DeepMind
4.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

4. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
5.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

5. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться