Базы данных ЭЭГ

Когда число записей, которое делает пользователь в своей практике, превышает несколько сотен, становится трудно управлять данными. Специальные инструменты позволяют пользователю манипулировать данными. Один из них — индивидуальная база данных. Индивидуальная база данных ЭЭГ — это структурированное собрание записей ЭЭГ, полученных пользователем. Записи сохранены в компьютере в специальном порядке так, чтобы управляющая программа могла обращаться к ним, чтобы ответить на вопросы. Например, нативные ЭЭГ-записи и результаты их обработки (такие как спектры, вейвлет-преобразования или вызванные потенциалы) обычно хранятся в различных папках. Эти различные категории файлов описываются в соответствии с определенной схемой. Например, схема описывает объекты, которые представлены в базе данных именем пациента, датой рождения, датой регистрации, пола, диагноза, вычисленных параметров и т.д. Схема становится важной, когда мы хотим получить усредненные значения для данного возраста, пола или диагноза. Эго также помогает искать отдельного пациента или отдельную дату регистрации. Компьютерная программа, используемая для управления и запроса информации из базы данных, известна как система управления базой данных. Первые системы управления базы данных появились в 1960-х. В области ЭЭГ они стали стандартным инструментом.

NxLink

Первая нормативная база данных была разработана группой исследователей из Нью-Йоркского университета, возглавляемой Роем Джоном, в конце 1980-х. Термин «нейрометрика» (neurometries) сначала применялся этой группой для описания аналогии с психометрической оценкой, обычно используемой в клинической психологии. В нейрометрической базе данных присутствуют следующие параметры ЭЭГ: абсолютная мощность, относительная мощность, когерентность, средняя частота в пределах диапазона ритма и симметрии (левая — правая и передняя — задняя), рассчитанные приблизительно с двухминутной записи ЭЭГ (без удаления артефактов) с закрытыми глазами. Проанализированный диапазон частот ЭЭГ от 0,5 до 25 Гц. Извлеченные параметры преобразованы до гауссовского (нормального) распределения. Две тысячи восемьдесят четыре (2084) переменные вычислены для каждого члена базы данных. Была отмечена корреляция особенностей ЭЭГ с возрастом и были получены уравнения регрессии для учета эффектов возраста. Одномерные и многомерные Z-параметры (Z-scores) были вычислены для характеристики отклонений индивидуума от среднего по популяции. База данных NxLink включает измерения приблизительно от 782 нормальных индивидуумов. Из этого общего количества 356 — в возрасте 6— 16 лет и 426 — в возрасте 16—90. Более чем 4000 клинических наблюдений использовались в дискриминантной части программного обеспечения. Ограничения базы данных следующие: 1) были проанализированы и нормализованы записи ЭЭГ только в состоянии покоя с закрытыми глазами; 2) сравнения сделаны только с частотными полосами ЭЭГ, такими как дельта-, тета-, альфа- и низкочастотный бета-диапазоны.

Neuroguide

База данных, разработанная Робертом В. Тэтчером (Thatcher Lifespan Normative EEG Database — Neuroguide), в настоящее время содержит информацию от 625 индивидуумов, охватывая возрастной диапазон от 2 месяцев до 82,6 года. Используются передовые методы, включающие: более обширную перекрестную проверку и проверку гауссовских распределений для среднего взвешенного монтажа, для монтажа с объединенными ушными электродами, Лапласиана в состоянии с открытыми и закрытыми глазами. База данных NeuroGuide была проверена и перепроверена, для каждого монтажа и состояния была рассчитана чувствительность статистических распределений. Девятьсот сорок три (943) переменные вычислены для каждого субъекта, включая значения абсолютной и относительной мощности, когерентности, фазы, асимметрии и отношений мощности. Значения Z-параметров доступны в отдельных одночастотных интервалах. Скользящее среднее используется для вычисления нормы, соответствующей возрастам. Результаты проверены на гауссовское распределение. Главное ограничение этой базы данных — отсутствие регистрации ЭЭГ в условиях выполнения задач.

SKIL

База данных SKIL, разработанная Барри Стерманом и Дэвидом Кэйзером, в настоящее время включает 135 взрослых в возрасте 18—55 лет. Референтная популяция состоит из студентов и лабораторного персонала (50 %), волонтеров, набранных из населения (25 %), и персонала американских воздушных сил (25 %). База данных SKIL включает записи ЭЭГ в покое (при закрытых и открытых глазах) и во время состояния решения задач, включая чтение, математические задачи и некоторые другие. На данный момент доступна коррекция записей, которая базируется на объединенных перекрестной и лонгитюдной информации, а не предпочтительном методе отслеживания внугрисубъектных изменений с течением времени. База данных SKIL охватывает ограниченный диапазон частот от 2 до 25 Гц. База данных содержит нормы для каждого единичного приращения в Гц в этом диапазоне частот. В базе данных SKIL используется исключительно объединенный ушной референт. Ограничения базы данных: 1) никакая нормативная информация, касающаяся детей или молодых взрослых, в настоящее время не доступна; 2) задачи не были стандартизированы, чтобы рассчитать вызванные потенциалы.

Neurorep

Билл Хадспет (Bill Hudspeth) предлагает Neurorep AQR (база эталонных ЭЭГ-данных для взрослых). Одна из самых полезных особенностей работы Хадспета — акцент на надежности измерений, полученных от отдельных пациентов, и важности изменчивости ЭЭГ во времени как клинического индекса. Данные ЭЭГ доступны для состояний с открытыми и с закрытыми глазами. База данных включает значения абсолютной и относительной мощности для 19 скальповых электродов и всех комбинаций пар электродов для когерентности, фазы, асимметрии и индексов корреляции. Общее количество индивидуумов в AQR в настоящее время довольно незначительное (< 50), но собираются дополнительные данные.

Франк X. Даффай, MD

Франк X. Даффай, MD, также разработал базу данных ЭЭГ, которая включает состояния с открытыми и с закрытыми глазами и охватывает широкий возрастной диапазон, в том числе детей и взрослых. Доступны данные ЭЭГ для 19 электродов, включены также значения слуховых и зрительных ВП. Эта база данных прежде использовалась в нескольких коммерческих нейродиаг-ностических инструментах (Nicolet, QSI), но, как нам известно, в настоящее время недоступна.

База данных Novatech LORETA

Сначала база данных LORETA была разработана Марко Конхедо и Лесли Шер-лином из NovaTech. В базе данных в настоящее время имеются 84 наблюдения и активно добавляются новые. Эта ЭЭГ-технология визуализации дает возможность томографического представления источников ЭЭГ в 3-мерном пространстве. Эта база данных полезна не только для выявления отклонений, но и для приблизительной оценки локализации областей мозга, вовлеченных в заданную деятельность.

База данных BRC

Одно из самых захватывающих событий в области создания баз данных ЭЭГ в течение прошлых нескольких лет — разработка первой стандартизированной Международной базы данных мозга. В ней преодолеваются проблемы баз данных, представленных выше. Проводились консультации с консорциумом ведущих нейрофизиологов и неврологов для оптимального выбора тестов, которые задействуют главные мозговые сети и процессы и позволят их оценить в течение короткого времени. Были устроены шесть лабораторий с идентичным оборудованием и программным обеспечением (в Нью-Йорке, Род-Айленде, Лондоне, Голландии, Аделаиде и Сиднее) под эгидой общественной компании (The Brain Resource Company), с новыми лабораториями, которые будут добавляться в дальнейшем. Были зарегистрированы сотни нормальных испытуемых, также недавно началась оценка групп клинических пациентов.

База данных BRC включает данные не только ЭЭГ- и ERP-параметров при выполнении батареи простых задач (такие как слуховые и зрительные oddball -задачи), но также при выполнении батареи разносторонних психологических тестов, регистрация при этом проводилась при использовании сенсорных мониторов. Также для многих отдельных индивидуумов получены структурные и функциональные MRI-данные. В дальнейшем будет систематически собираться генетическая информация для сравнения с нейроанатомическими, нейрофизиологическими и психометрическими измерениями.

База данных HBI

База данных HBI была разработана как совместное научно-практическое предприятие трех человек: программиста Валерия Пономарева, психолога Андреаса Мюллера и Кропотова Юрия. Эта база данных базируется на методологии, разработанной в лаборатории нейробиологии программирования действия Института мозга человека Российской академии наук (зав. лаб. Ю.Д. Кропотов). База данных включает ЭЭГ, зарегистрированную в состоянии с открытыми и закрытыми глазами в состоянии спокойного бодрствования и в условиях выполнения пяти различных задач (двухстимульной GO/NOGO-задачи, математической задачи, чтения, слуховой задачи на воспроизведение и слуховых oddball-задач) у более чем 1000 относительно здоровых испытуемых в возрасте от 7 до 98 лет. База данных также включает записи больше чем 1000 детей и подростков с диагнозом СДВГ, также как многочисленные записи ЭЭГ пациентов с другими диагнозами (пациенты с эпилепсией, обсессивно-компульсивным синдромом, склонностью к депрессиям, травмами шеи и т.д.)

Чтобы уменьшить время для предварительной обработки данных, были автоматизированы некоторые процедуры (такие как коррекция артефактов и обнаружения спайков). Для оценки общих и локальных характеристик ЭЭГ используется три монтажа (монтаж с объединенным ушным референтом, средний и взвешенный средний референт). Абсолютная и относительная амплитуда и спектры мощности, средняя и парная когерентность, волновой (вейвлет) анализ и ВП-параметры вычислены и нанесены на карту в двухмерные или в трехмерные изображения, с использованием технологий LORETA и sLORETA. Также доступны методы оценки диполя. Кроме того, ВП подвергнуты анализу независимых компонент. С использованием этого метода выявлены отдельные компоненты, связанные с отдельными психическими операциями. Каждая компонента характеризуется временной динамикой и распределением. На основе этих распределений созданы пространственные фильтры, которые позволяют пользователям выявить амплитуду и латентность каждой компоненты индивидуального ВП. Сравнение этих параметров с нормативными данными создает понимание различных стадий обработки информации у людей.

Базы данных физиологических сигналов «physionet.org»

Разработчики и производители электронной медицинской аппаратуры, в которой используются различные методы математической обработки и анализа биомедицинских сигналов, постоянно сталкиваются с проблемой получения выборок реальных данных, необходимых как для поддержки работ по созданию алгоритмов и методов анализа, так и для оценки качества разработанных методов.

Сбор достаточного объема экспериментальных данных может оказаться очень длительной и дорогостоящей работой, так как требует привлечения квалифицированных специалистов, использования специальной аппаратуры, решения ряда организационных и этических проблем. Кроме того, некоторые из видов патологий встречаются редко, и получение соответствующих записей сигналов может потребовать неопределенного времени.

Для того чтобы помочь исследователям и производителям медицинской техники в решении перечисленных выше проблем, в 191)9 г. был введен в действие специализированный интернет-портал «PhysioNet Resource»1, доступный по адресу «physionet.org». Данный интернет-ресурс финансируется двумя подразделениями американского Национального института здоровья (National Institutes of Health. N1H): Национальным институтом биомедицинских изображений и биоинженерии (National Institute of Biomedical Imaging and Bioengineering, NIBIB) и Национальным институтом общемедицинских наук (National Institute of General Medical Sciences, NIGMS).

Примерно начиная с 1970-х годов, специалисты из Массачусетского технологического института (Massachusetts Institute of Technology; MIT, Бостон, США), работая над созданием первых микропроцессорных кардиологических мониторов, осознали необходимость формирования общедоступной базы данных аннотированных записей ЭКГ, которая могла бы послужить основой для разработки, совершенствования и объективного сравнения между собой алгоритмов автоматического анализа сердечного ритма по ЭКГ. Пятилетние усилия в этом направлении завершились в 1980 году созданием базы данных аритмий (М1Т-В1Н Arrhythmia Database), которая за короткое время завоевала репутацию общепринятого стандарта. Вслед за этим одна за другой начали появляться новые базы данных ЭКГ и других физиологических сигналов. К 1999 г. сотрудниками MIT был распространен комплект оптических дисков, содержащих уже 11 подобных коллекций сигналов. Создание портала «PhysioNet Resource» позволило нс только сделать эти базы данных общедоступными, но и открыть возможность для расширения их состава всеми желающими исследователями.

Портал «PhysioNet Resource» включает в себя три основных компонента:

  • Архив записей сигналов «PhysioBank», представляющий собой большой и постоянно расширяющийся набор тщательно аннотированных цифровых записей физиологических сигналов, временных последовательностей и различного вида сопровождающей информации. В настоящее время (2016 год) «PhysioBank» содержит более 60 коллекций кардио-пульмонарных, неврологических и других сигналов как от здоровых пациентов, так и от пациентов, страдающих различными видами заболеваний. В частности, направленность данных коллекций охватывает такие социально значимые медицинские проблемы, как внезапная кардиологическая смерть, застойная сердечная недостаточность, эпилепсия, нарушения походки, апноэ сна и старение.
  • Библиотека программ «PhysioToolkit» является обширным и постоянно расширяющимся набором программных средств, предназначенных для обработки и анализа физиологических сигналов, обнаружения значимых с точки зрения физиологии событий, интерактивного отображения и аннотирования сигналов, создания новых баз данных, моделирования физиологических и других сигналов, количественной оценки и сравнения методов анализа сигналов, а также для анализа нестационарных сигналов. Всё программное обеспечение свободно доступно в форме исходных кодов программ на условиях общественной лицензии «GNU» (General Public License, GPL).
  • Виртуальная лаборатория «PhysioNetWorks» обеспечивает возможность сотрудничества с коллегами со всего мира в направлении создания, оценки, совершенствования, документирования и подготовки новых данных и программных средств для публикации на портале «PhysioNet Resource». В отличие от остальных двух компонентов портала, доступ в виртуальную лабораторию защищен паролем (который легко может быть получен в течении нескольких минут). Для участников лаборатории доступны надежные средства сохранения данных, удобные программы для просмотра и аннотирования сигналов, а также возможность интерактивного взаимодействия с более чем 3000 других исследователей.

Все базы данных, размещаемые на портале «PhysioNet Resource», должны быть подготовлены в соответствии со специально разработанным форматом, который предусматривает три вида файлов:

  1.  Заголовочные файлы. Представляют собой небольшие текстовые файлы, которые описывают сигналы (имя или URL файла сигнала, формат хранения, количество и типы сигналов, частота дискретизации, информация о калибровке, характеристики аналого-цифрового преобразования, продолжительность записи и начальное время).
  2. Файлы аннотаций. Содержат набор меток, каждая из которых описывает свойства одного или нескольких сигналов в заданные моменты времени. Метки должны следовать в файле строго в порядке нарастания времени. Информация в файлах аннотаций упакована с использованием специального формата. Поэтому доступ к ней возможен только с помощью специальных программ из библиотеки «PhysioToolkit».
  3. Файлы сигналов. Содержат в бинарном виде цифровые отсчеты сигналов, которые могут быть представлены либо непосредственно значениями отсчетов, либо в одном из предусмотренных форматов упаковки, служащих для сокращения занимаемого объема памяти. Объём файлов сигналов может быть очень велик (до десятков и сотен мегабайт).

Все три вида файлов, относящихся к одной записи сигнала, должны иметь одинаковое имя, но разные расширения. Заголовочные файлы имеют расширение «hea», файлы данных — расширение «dat», а файлы аннотаций могут иметь произвольные расширения, определяемые создателями и пользователями конкретной базы данных. Причём одной и той же записи сигнала могут соответствовать несколько видов файлов аннотаций, что позволяет осуществлять аннотирование записей с различных точек зрения.

В качестве примера рассмотрим описание одной из двухканальных записей ЭКГ из базы данных аритмий «М1Т-В1П Arrhythmia Database». Эта запись в базе данных имеет имя «119». Рассмотрим содержимое заголовочного файла «119.hea»:

  • 119 2 360 650000
  • 119.dat 212 200 11 1024 825 2943 О MI.II
  • 119.dat 212 200 11 1024 930 -26388 О VI
  • # 51 F 1129 654 х2
  • # Pronestyl
  • # The PVCs arc uniform.

В первой строке указано имя записи (119). число каналов сигнала (2), частота дискретизации (360 Гц) и общее число отсчетов сигнала в каждом из каналов (650000).

Во второй и третьей строках содержится информация, относящаяся к сигналам первого и второго каналов соответственно. Например, данные для первого канала, перечисленные во второй строке заголовочного файла имеют следующий смысл:

  • 119.dat — имя файла, в котором содержится сигнал;
  • 212 — обозначение используемого формата упаковки отсчетов сигнала;
  • 200 – масштаб сигнала (число уровней квантования на I мВ);
  • 11 разрядность аналого-цифрового преобразования; 1024 уровень нулевой линии дискретизованного сигнала;
  • 825 — значение первого отсчета сигнала по данному каналу;
  • 2943 — контрольная сумма, служащая для проверки ошибок;
  • 0 — размер буфера для чтения сигнала (здесь не используется);
  • MLII — обозначение отведения ЭКГ (здесь — мониторное отведение II).

Последние три строки заголовочною файла содержат комментарии для данной записи ЭКГ.

В файле с именем «119.dat» сигнал записан в виде последовательности II-битных отсчетов, представляющих собой целые неотрицательные числа, которые могут принимать значения от 0 до 2047. Для пересчета сигнала к общепринятому масштабу в милливольтах необходимо от каждого значения отнять величину указанного в заголовочном файле уровня нулевой линии (1024) и разделить результат на величину масштаба сигнала (400).

Ниже приведены данные из файла аннотаций, относящиеся к показанному на рисунке фрагменту сигнала:

  • 32 +
  • 309 N
  • 503 V
  • 977 N
  • 1315 N
  • 1651 N
  • 1971 N
  • 2294 N
  • 2488 V
  • 2956 N
  • 3296 N

В первом поле каждой строки указана позиция отмеченной точки сигнала, выраженная в отсчетах (для перехода к времени в секундах это значение надо разделить на частоту дискретизации 360 Гц). Во втором поле каждой строки содержится идентификатор, раскрывающей смысл данной отметки времени. В нашем случае мы имеем три варианта таких идентификаторов:

  • + — признак смены ритма (в самом начале записи ставится всегда);
  • N — QRS-комплекс фонового ритма (относящийся к «норме»);
  • V желудочковый комплекс (желудочковая экстрасистола).

Отметим, что приведенный пример является очень упрощенной иллюстрацией. В действительности, предлагаемый формат представления данных намного сложнее и обеспечивает пользователю богатый и гибкий набор возможностей. Подробное описание как форматов данных, так и специализированных программ для манипуляций с данными содержится в инструкциях, доступных на портале «PhysioNet Resource».

Одной из наиболее важных возможностей, предлагаемых порталом «PhysioNet Resource», является набор функций, позволяющих выполнять сравнение между собой различных алгоритмов обработки и анализа физиологических сигналов. Эта возможность поддерживается специализированным программным обеспечением, свободно доступным на данном сайте. Сравнение осуществляется путем сопоставления данных, содержащихся в двух файлах аннотаций, из которых один обычно содержит данные верификации (то есть служит эталоном), а другой — выраженные в тех же терминах и представленные в том же формате результаты работы некоторого испытуемого алгоритма. Программы реализуют сравнение информации из пары сравниваемых файлов аннотаций, подсчет ошибок и формирование итоговых таблиц, в которых имеются как сводные результаты по всему используемому набору записей, так и подробная расшифровка для каждой из записей. Анализ получаемых результатов позволяет как получать объективные стандартизованные оценки качества алгоритмов, так и осуществлять целенаправленную работу по совершенствованию программно-алгоритмического обеспечения систем анализа биомедицинских сигналов.

Наиболее часто решаемой задачей в медицинских системах обработки информации является выявление тех или иных патологий (например, экстрасистол в случае анализа сердечных аритмий).

Footnotes

  1. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals. Circulation. 2000 Jun 13; 101 (23) :E215-20.