Ранняя диагностика различных заболеваний на основе биологических маркеров в последние годы становится более актуальной [7, 9]. В кардиологии большой интерес вызывает выявление в крови биомаркеров, характеризующих состояние атеросклеротической бляшки (АСБ). В последнее время широко обсуждается роль матриксных металлопротеиназ (ММП) и их тканевых ингибиторов (ТИМП) в патогенезе нестабильности АСБ [13]. Анализ современных литературных источников показал, что необходимы дальнейшие исследования, чтобы понять роль ММП и ТИМП, вовлеченных в атерогенез и разрыв бляшки. Настоящая работа выполнена в соответствии с приоритетными направлениями развития науки и технологии Республики Узбекистан в рамках программы ГНТП-9 «Разработка новых технологий профилактики, диагностики, лечения и реабилитации заболеваний человека» в рамках прикладного Государственного научно-технического проекта МЗ РУз АДСС 25 «Разработка метода ранней прижизненной диагностики атеросклероза магистральных артерий».
Цель исследования – разработка информационной модели нестабильности атеросклеротической бляшки с учетом активности матриксных металлопротеаз и их тканевых ингибиторов.
Материалы и методы исследования
Работа по интеллектуальному анализу медицинских данных по атеросклеротическим бляшкам проводилась совместно с сотрудниками кафедры программных и сетевых технологий Национального университета Узбекистана имени М. Улугбека.
По данным клинических, лабораторных, инструментальных исследований сформирована обучающая выборка, которая послужила основой при построении информационной модели для решения задач прогнозирования. Для решения задач математического моделирования с использованием обобщенных оценок мы отобрали данные 73 больных ИБС со стенозом сонной артерии более 50 %. Основным условием включения в анализируемую базу данных было отсутствие пропусков в вариационном ряде. В базу данных введено 83 параметра. В работе использовались обобщённые оценки – агрегированные (комбинированные) показатели, которые применялись для отображения отношений между объектами двух групп (классов K1, K2) в разнотипном признаковом пространстве на числовую ось. В K1, K2 включены соответственно пациенты со стабильными и нестабильными АСБ более 50 % по результатам предварительного дуплексного сканирования. Для получения комбинированных показателей использовано правило агломеративной иерархической группировки разнотипных признаков с целью нелинейного отображения их значений в описании объектов на числовую ось.
Результаты исследования и их обсуждение
Анализ данных проведенного исследования включал следующие этапы:
1. Разведочный анализ с учетом пропусков (не измеренных значений) в данных.
2. Формирование набора информативных признаков на основе оценки их вкладов в процесс разделения классов.
3. Формирование обучающей выборки путём удаления шумовых объектов.
4. Отбор индивидуальных информативных наборов признаков для каждого объекта.
5. Нелинейное отображение определяемых наборов признаков на числовую ось и формирование решающего правила.
Для разработки информационной модели использовано 9 методов обследования, 83 параметра (признака), 73 из которых измерялись в количественных и 10 в номинальной шкалах измерений.
Использование традиционных методов статистики (например, метода Стьюдента) допускает включение в анализ только количественных признаков. Методы статистики не позволяют оценить значимость качественных показателей и сочетаний количественных и качественных показателей в принятии решений. Статистические характеристики количественных признаков по классам K1, K2 приведены в таблице.
Статистические характеристики количественных признаков по стабильным и нестабильным АСБ
Название признака, единица измерения |
K1 Больные со стабильными атеросклеротическими бляшками |
K2 Больные с нестабильными атеросклеротическими бляшками |
Значение p по Стъюденту |
1 |
2 |
3 |
4 |
Возраст, годы |
67,9 ± 1,5 |
62,8 ± 1,2 |
> 0,05 |
Мужчины/женщины, n (%) |
30/15 (67/33) |
25/3 (89/11)* |
< 0,05 |
Рост, м |
1,68 ± 0,01 |
1,70 ± 0,01 |
> 0,05 |
Вес, кг |
78,31 ± 1,89 |
78,36 ± 2,4 |
> 0,05 |
Индекс массы тела, усл. ед. (кг/м2) |
27,7 ± 0,59 |
27,2 ± 0,79 |
> 0,05 |
Частота сердечных сокращений покоя, уд./мин |
73,91 ± 1,88 |
76,18 ± 1,87 |
> 0,05 |
Систолическое артериальное давление, мм рт.ст. |
130,78 ± 3,09 |
132,5 ± 2,45 |
> 0,05 |
Диастолическое артериальное давление, мм рт.ст. |
80,89 ± 1,65 |
83,57 ± 1,17 |
> 0,05 |
Артериальная гипертония, n (%) |
42 (93,3) |
26 (92,9) |
> 0,05 |
Гиперлипидемия, n (%) |
22 (48,9) |
15 (53,6) |
> 0,05 |
Ожирение, n (%) |
19 (42,2) |
7 (25) |
> 0,05 |
Сахарный диабет, n (%) |
14 (31,1) |
14 (50) |
> 0,05 |
Стенокардия напряжения: n (%) ФК II ФК III |
32 (71,1) 4 (8,9) |
23 (82,1) 3 (10,7) |
> 0,05 > 0,05 |
Инфаркт миокарда в анамнезе, n (%) |
6 (13,3) |
4 (14,3) |
> 0,05 |
Перенесенный инсульт, n (%) |
10 (22,2) |
16 (57,1)* |
< 0,01 |
Периферический атеросклероз, n (%) |
1 (2,2) |
4 (14,3) |
> 0,05 |
Положительный семейный анамнез, n (%) |
1 (2,2) |
5 (17,9)* |
< 0,05 |
Курение, n (%) |
3 (6,7) |
7 (25)* |
< 0,05 |
Применение бета-адреноблокаторов, n (%) |
32 (71,1) |
10 (35,7)* |
< 0,02 |
Применение статинов, n (%) |
14 (31,1) |
22 (78,6)* |
< 0,001 |
Максимальная толщина комплекса «интима-медиа» общей сонной артерии в стандартной точке измерения, мм |
0,99 ± 0,04 |
1,2 ± 0,05* |
< 0,002 |
Максимальная степень стеноза сонных артерий, % |
44,2 ± 3,6 |
75,4 ± 2,9* |
< 0,001 |
1 |
2 |
3 |
4 |
Тип атеросклеротической бляшки слева |
2,86 ± 0,21 |
3,32 ± 0,31 |
> 0,05 |
Тип атеросклеротической бляшки справа |
3,35 ± 0,26 |
3,6 ± 0,28 |
> 0,05 |
Диаметр аорты, см |
3,3 ± 0,08 |
3,17 ± 0,05 |
> 0,05 |
Конечный диастолический размер, см |
5,22 ± 0,09 |
4,56 ± 0,08* |
< 0,001 |
Конечный диастолический объем, мл |
132,08 ± 5,19 |
99,21 ± 3,8* |
< 0,001 |
Диаметр левого предсердия, см |
3,4 ± 0,07 |
3,12 ± 0,04* |
< 0,001 |
Конечный систолический размер, см |
3,7 ± 0,09 |
2,94 ± 0,07* |
< 0,001 |
Конечный систолический объем, мл |
60,03 ± 3,49 |
35,04 ± 2,03* |
< 0,001 |
Толщина межжелудочковой перегородки, см |
1,18 ± 0,03 |
1,34 ± 0,06* |
< 0,05 |
Фракция выброса левого желудочка, % |
54,18 ± 1,3 |
64,07 ± 0,9* |
< 0,001 |
Ударный объем, мл |
72,03 ± 2,76 |
61,5 ± 2,62* |
< 0,02 |
Толщина задней стенки левого желудочка, см |
1,19 ± 0,03 |
1,27 ± 0,02* |
< 0,05 |
Толщина стенки правого желудочка, см |
2,99 ± 0,08 |
2,72 ± 0,02* |
< 0,002 |
Гипертрофия межжелудочковой перегородки, n (%) |
1 (2,2) |
1 (3,6) |
> 0,05 |
Диастолическая дисфункция левого желудочка, n (%) |
12 (26,7) |
25 (89,3)* |
< 0,001 |
Атриовентрикулярная блокада, n (%) |
1 (2,2) |
1 (3,6) |
> 0,05 |
Блокада левой ножки пучка Гисса, n (%) |
1 (2,2) |
1 (3,6) |
> 0,05 |
Сахар в крови, ммоль/л |
5,69 ± 0,24 |
6,68 ± 0,46 |
> 0,05 |
Общий холестерин, ммоль/л |
5,2 ± 0,16 |
4,6 ± 0,18 |
> 0,05 |
Триглицериды, ммоль/л |
1,8 ± 0,12 |
2,2 ± 0,29 |
> 0,05 |
Холестерин липопротеидов высокой плотности, ммоль/л |
0,94 ± 0,02 |
1,04 ± 0,05 |
> 0,05 |
Холестерин липопротеидов низкой плотности, ммоль/л |
3,7 ± 0,12 |
3,2 ± 0,15 |
> 0,05 |
Индекс атерогенности < = 3,0 (ХС ЛНП/ХС ЛВП) |
3,98 ± 0,12 |
3,24 ± 0,16 |
< 0,001 |
Коэффициент атерогенности < = 3,5 ((ОХС-ЛВП)/ЛВП) |
4,59 ± 0,14 |
3,48 ± 0,15 |
< 0,001 |
Матриксная металлопротеиназа-9, нг/мл |
200,9 ± 8,5 |
539,03 ± 57,1 |
< 0,001 |
Тканевой ингибитор металлопротеиназы-1, нг/мл |
1180,98 ± 47,98 |
2410,2 ± 123,8 |
< 0,001 |
Матриксная металлопротеиназа-9/ тканевой ингибитор металлопротеиназы-1 |
0,18 ± 0,009 |
0,24 ± 0,03 |
> 0,05 |
Цинк в сыворотке, мкмоль/л |
13,7 ± 1,4 |
15,9 ± 0,62 |
> 0,05 |
Цинк в волосах, мкг/г |
220,5 ± 17,07 |
212,5 ± 17,01 |
> 0,05 |
Цинк в бляшках, мкг/г |
– |
82,8 ± 16,8 |
– |
Учитывая сложность постановки диагноза в многопараметрическом пространстве, предлагается в качестве инструментария при формировании математической модели диагностирования пациентов со стабильной и нестабильной АСБ применить технологию синтеза обобщенных оценок. Обобщённые оценки – это агрегированные (комбинированные) показатели, которые используются для отображения отношений между объектами двух групп (классов K1, K2) в разнотипном признаковом пространстве на числовую ось [1].
Комбинированные показатели формируют новое признаковое пространство, размерность которого меньше исходного. Для получения комбинированных показателей использовано правило агломеративной иерархической группировки разнотипных признаков с целью нелинейного отображения их значений в описании объектов на числовую ось. Результаты нелинейного отображения рассматривались как значения обобщённых оценок (новых признаков) в описании объектов.
При решении задач прогнозирования АСБ применялся метод поиска логических закономерностей в форме нелинейных проекций обобщённых оценок объектов по определяемым наборам из 31-го признака (симптома, синдрома) на выборке из представителей классов K1 и K2. В самую устойчивую закономерность вошли 5 исходных показателей: вес пациента, ТИМП-1, ММП-9, ФВ, СССА. Согласно решающему правилу с пороговым значением [2] вычислялось значение индекса нестабильности атеросклеротической бляшки (ИНАСБ):
ИНАСБ = 0,2∙(0,99623∙(y3 – 0,02887) – – 0,0061∙(СССА – 55,0)) + 0,8∙(9,1088603533E – 03)∙(y3∙СССА + 1,41804) – 0,0125,
где
y1 = 0,3∙(–0,00059∙(ММП-9 – 274,96) – 0,0003∙(ТИМП-1 – 1602,878)) + + 0,7∙(–2,6440737712E – 07)∙(ММП-9∙ТИМП-1 – 428481,41184);
y2 = 0,2∙(1,00483∙(y1 + 0,01192) – 0,0091∙(ФВ % – 60,0)) + + 0,8∙(1,5979164850E – 02)∙(y1∙ФВ % + 0,77465);
y3 = 0,6∙(0,00448∙(вес – 72,0) + 1,06∙(y2 + 0,00913)) + + 0,4∙(1,0333362905E – 02)∙(вес∙y2 + 0,72105).
Если ИНАСБ > 0, то пациент относится к классу стабильной АСБ, при ИНАСБ < 0 – к классу нестабильной АСБ. Пороговое значение для решающего правила из [2] вычислялось по формуле
где min K1, max K2 – сответственно минимальное значение обобщённой оценки из класса K1 и максимальное из K2 [3].
Математический аппарат интеллектуального анализа данных является наиболее приемлемой альтернативой традиционному статистическому анализу, так как позволяет избежать искажения результатов оценки риска развития клинических проявлений атеросклероза в случаях введения в систему новых данных, появления данных, существенно отличающихся от основной массы наблюдений, и ошибочных измерений [10, 12]. Для извлечения новых знаний (скрытых закономерностей) из базы данных мы использовали современные методы интеллектуального анализа [6].
В отличие от традиционных статистических методов интеллектуальный анализ находит широкое применение там, где необходимо моделировать подобие человеческой интуиции и, как правило, трудно построить явные алгоритмы. Для достижения высокой точности решения прикладных задач данные должны соответствовать набору жестких требований. Из теории и практики вычислений известно, что эти требования часто бывают диаметрально противоположными. Алгоритмы методов интеллектуального анализа могут использоваться в качестве инструментария для пополнения баз знаний экспертных систем [1].
Опыт использования системы диагностики доклинического атеросклероза подтвердил эффективность применения медицинской статусметрии в целях своевременной профилактики сердечно-сосудистых заболеваний атерогенной природы. Однако одновременно был выявлен и ряд серьезных недостатков используемой системы, проявляющихся в значительном искажении оценки риска для лиц, показатели которых имели значения, далеко отстоящие от основной массы наблюдений [8].
В другом исследовании [11, 12] искусственные нейронные сети (ИНС) рассматривались в качестве математического аппарата, воспроизводящего условную функцию частоты на основании альтернативных обучающих выборок. Математический аппарат ИНС приведен как наиболее приемлемая альтернатива модели Фишера для оценки риска развития атеросклероза по данным врачебных, инструментальных и лабораторных исследований.
В отличие от перечисленных выше исследований применение метода вычисления обобщенных оценок с помощью иерархической агломеративной группировки в нашей работе было целесообразным по следующим причинам [1]:
– обобщённые оценки образуют новое признаковое пространство, размеры которого меньше исходного;
– решается проблема использования алгоритмов классификации, реализация которых была неэффективна из-за большой размерности признакового пространства, либо возможна при одном типе шкал измерений;
– в процессе группировки происходит последовательный отбор информативных наборов признаков;
– нелинейное отображение описаний объектов на числовую ось по определяемым комбинациям признаков является средством обнаружения устойчивых логических закономерностей (новых знаний) в хранилищах данных [2].
Нелинейное отображение описаний объектов на числовую ось по определяемым комбинациям признаков является средством обнаружения устойчивых логических закономерностей (новых знаний) в хранилищах данных [1, 2, 3, 4, 5]. Статистические методы для этих целей не подходят, так как в процессе вычисления статистических показателей используются усредненные данные.
В работе решалась задача повышения информативности и устойчивости прогнозирования нестабильности АСБ у пациентов с каротидным атеросклерозом за счет вычисления индекса нестабильности атеросклеротической бляшки. Существующие методы прогнозирования (например, способ индивидуальной количественной оценки риска развития клинических проявлений атеросклероза [8]) имеют основной недостаток – большое число исследуемых параметров показателей, полученных в ходе клинического обследования, которые попадают в область равенства прогностических коэффициентов.
В данном исследовании поставленная задача решается с применением решающего правила в форме нелинейных зависимостей между такими пятью исходными показателями как вес пациента, ТИМП-1, ММП-9, ФВ, СССА. Эти исходные показатели образуют латентный (явно не измеряемый) признак. Смысл полученного результата заключается в повышении информативности и устойчивости оценки риска развития нестабильной АСБ и индивидуального риска развития клинических осложнений АСБ. В самую устойчивую закономерность вошли пять исходных показателей: вес пациента, ТИМП-1, ММП-9, ФВ, СССА. Используя данные предварительного обследования и значений этих пяти показателей (вес пациента, ТИМП-1, ММП-9, ФВ, СССА), которые прямо или косвенно отражают интенсивность развития атеросклеротических процессов на всех стадиях развития, в клинической практике возможно с высокой эффективностью прогнозировать нестабильность атеросклеротической бляшки. Данные верификации разработанной модели диагностики атеросклеротического процесса показали в 92 % случаев соответствие диагнозам пациентов, полученным по экспертной информации.
Высокая чувствительность метода к изменению взаимосвязей показателей позволяет спрогнозировать развитие нестабильности АСБ, провести своевременные профилактические и лечебные мероприятия. Последующий анализ динамики риска позволяет также оценить эффективность принятых мер и при необходимости скорректировать профилактику и лечение клинического атеросклероза.
Выводы
1. Разработанный алгоритм автоматизированной диагностики с использованием математических методов способствует повышению информативности и устойчивости прогнозирования нестабильности АСБ у пациентов с каротидным атеросклерозом за счет вычисления индекса нестабильности атеросклеротической бляшки.
2. Выделенные на основе информационного подхода наиболее существенные «веcомые» факторы, вошедшие в наиболее устойчивую закономерность (вес пациента, сывороточный уровень ТИМП-1, ММП-9, фракция выброса левого желудочка по данным эхокардиографии и степень стеноза сонных артерий по данным дуплексного сканирования) позволяют оптимизировать лечебно-диагностический процесс при атеросклерозе. Получено решающее правило, согласно которому на основе вышеуказанных факторов можно вычислить значение индекса нестабильности атеросклеротической бляшки.
3. Разработанная логическая модель НАСБ направлена на повышение достоверности результатов диагностики. Данные верификации разработанной модели диагностики атеросклеротического процесса показали в 92 % случаев соответствие диагнозам пациентов, полученным по экспертной информации.