Методы теории статистических решений

Медицинская диагностика на основе теории статистических решений

Постановка диагноза врачом – результат сложного процесса осмысливания и сопоставления большого количества информации. Достоверность диагноза зависит от опыта, накопленного специалистом в данной области медицины. Результаты диагностического процесса зависят также от личных качеств врача. Методы автоматической диагностики свободны от многих свойственных человеку недостатков, но уступают человеку в области творчества, интуиции. В настоящий момент для постановки диагноза с помощью компьютера применяются различные методы: вероятностные, обучения распознаванию, математической логики и др.

Вероятностные алгоритмы. Метод Байеса

В клинической практике известны симптомы, наличие которых однозначно определяет заболевания. С другой стороны, встречаются симптомы, исключающие тот или иной диагноз. Однако подобная детерминированность представляет скорее исключение, чем правило. Чаще всего кардинальных, определяющих клинику симптомов нет, и любой из них может встречаться с некоторой частотой при различных заболеваниях.

Естественным поэтому является использование вероятностных методов для постановки диагноза.

Пусть необходимо проводить дифференциальную диагностику между заболеваниями D₁, D₂, …, D_n. Для каждого из них характерно распределение условных вероятностей Р(S | D_j) появления у больного того или иного симптомокомплекса: S = {S₁, …. S_k…..S_n}, где S_iвозможные значения (градации) различных симптомов. Если бы эти pacпределения, а также априорные вероятности заболеваний P(D_j) были заданы, то задача дифференциальной диагностики свелась бы к статистической задаче выбора гипотез, оптимальное диагностическое правило для которой нетрудно построить с помощью известной формулы Байеса. Последняя для апостериорной вероятности диагноза D_jдает выражение

$P\left(D_{j} | S_{i}\right)=\left(P\left(D_{j}\right) P\left(S | D_{j}\right)\right) /\left(\sum_{j} P\left(D_{j}\right) P\left(S | D_{j}\right)\right)$ (1.47)

где P(D_j) — априорная вероятность заболевания с диагнозом D_j среди рассматриваемой группы болезней; P(S | D_j) — вероятность появления комплекса признаков при диагнозе D_j.

Если для какого-нибудь D_j* вероятность P(D_j* | S) значительно превосходит вероятность P(D_j | S) для других j ≠ j*, оптимальное правило приписывает больному заболевание D_j* . Словам «значительно превосходит» легко придать количественный смысл.

Широкому распространению такого решающего правила существенно препятствует то, что распределения P(S | D_j) и вероятности P(Dj) не заданы. И если вероятность заболеваний P(Dj) можно с достаточной точностью оценить, вычислив на достаточно большом клиническом материале частоты, с которыми рассматриваемые болезни встречаются, то определение распределения P(S | D_j) значительно сложнее. Последнее обстоятельство связано с тем, что для каждого диагноза необходимо определить условную вероятность любой комбинации признаков. Но уже для 30 двоичных клинических параметров мы имеем свыше миллиарда симптомокомплексов, составленных из принятых признаков. Разумеется, собрать клинический массив для оценки условных вероятностей P(S | D_j) совершенно невозможно. Единственным выходом в данной ситуации является использование вместо P(S | D_j) какой-нибудь аппроксимации, для оценки и запоминания которой не требуется столь больших масштабов. Вероятностные алгоритмы различаются, вообще говоря, способом аппроксимации P(S | D_j).

Наиболее распространено предположение, что события, состоящие в появлении у больных тех или иных значений рассматриваемых нами симптомов, статистически независимы. Тогда

$P\left(S | D_{j}\right)=\prod_{i} P\left(S_{i} | D_{j}\right)$

Теперь для задания P(S | D_j) уже нет необходимости запоминать и оценивать миллиарды чисел: достаточно иметь в памяти машины К_n чисел P(S_i| D_j)и n чисел P(D_j). Для десятков заболеваний и нескольких сотен признаков объем памяти не превысит несколько десятков тысяч чисел, что вполне доступно для современных ЭВМ. Кроме того, P(S_i| D_j) легко оценить, подсчитав частоту появления значений симптома S_i при заболевании D_j на достаточно большом количестве историй болезни.

Поскольку такой алгоритм, позволяющий получить достаточно хорошие результаты, широко распространен, остановимся на нем подробнее.

Медицинские сведения используются в виде диагностической таблицы, содержащей вероятности появления признаков для данной группы заболеваний. Представим для простоты, что диагностическая таблица составлена всего для трех заболеваний и содержит только 4 признака.

Обозначим условно диагнозы: D₁ — тетрада Фалло; D₂ — дефект межпредсердной перегородки; D₃ — незаращенный артериальный проток, и признаки: S₁ — цианоз; S₂ — усиление легочного рисунка; S₃ — акцент II гона во II межреберье слева; S₄ — правограмма (ЭКГ).

Признак S_p будет абсолютно достоверным, если при данном заболевании он встречается в 100 % случаев. Вероятность такого признака принимается за единицу. В общем случае вероятность признака при заболевании D_j равна

P(S_i| D_j) = n_ij/ (n_j — n_-ij),

где n_ij — число больных с диагнозом D_j, имеющих признак S_i; n_j -общее число больных с данным заболеванием; n_-ij— число больных с диагнозом D_j, нс обследованных на признак S_i.

Величина P(S_i| D_j) определяется на основании данных медицинской статистики, результатов обработки архивного материала и литературных данных, причем будет тем более достоверна, чем больше n.

Предположим¹², что по данным статистики при D₁ признак S₁ встречается в 90 % случаев, S₂ не встречается (0 %), S₃ встречается в 5 %, S₄ в 60 % случаев; при D₂ признак встречается в 15 %, S₂–S₄ — в 80 % случаев; при D₃ признак S₁ встречается в 100 %, S₂ — в 95 %, S₃ — в 90 %, S₄ — в 10 % случаев.

Будем также считать, что априорная вероятность заболевания D₁ равна 35 %, D₂ — 15 % и D₃ – 50 %.

В диагностической таблице эти данные могут быть представлены, как в табл. 1.

Таблица 1

D_j	P(D_j)	P(S₁\| D_j)	P(S₂\| D_j)	P(S₃\| D_j)	P(S₄\| D_j)
D₁	0,35	0,90	0	0,05	0,60
_D2	0,15	0,15	0,80	0,80	0,80
D₃	0.50	0,10	0,95	0,90	0,10

Апостериорная вероятность диагноза D_j при наличии комплекса признаков S определяется по приведенной ранее формуле Байса.

Предполагая признаки независимыми, будем иметь в рассматриваемом случае

$P(S)=\sum_{j=1}^{3} P\left(D_{j}\right) P\left(S_{1} | D_{j}\right) P\left(S_{2} | D_{j}\right) P\left(S_{3} | D_{j}\right) P\left(S_{4} | D_{j}\right)$ . (1.49)

Вычислим вероятности диагноза сначала в том случае, когда у больного проявились все четыре признака. Тогда по формулам (1.47)-(1.49) находим вероятности диагнозов P(D₁ | S) = 0; P(D₂ | S) = 0,73; P(D₃ | S) = 0,27. При диагностике по методу Байеса предполагается, что у больного имеется одно из заболеваний, содержащихся в диагностической таблице. Таким образом, наиболее вероятным оказывается диагноз D₂.

Теперь рассмотрим случай, когда у больного отсутствует признак S₁ (цианоз), но имеются все остальные признаки. Вероятность отсутствия признака S₁ равна

P( $\bar{S}_{1}$ | D_j) = 1 – P(S₁| D_j).

Расчет проводится точно так же, но вероятность P(S₁| D_j) в формуле (1.47) заменяется на 1 – P(S₁| D_j). В результате получим

P(D₁ | $\bar{S}_{1}$ ) = 0; P(D₂ | $\bar{S}_{1}$ ) = 0,63; P(D₃ | $\bar{S}_{1}$ ) – 0,37.

В табл. 2 приведены вероятности диагнозов при наличии всех признаков и при отсутствии одного из них.

Таблица 2

D_j	Признаки
D_j	S₁, S₂, S₃, S₄	$\bar{S}_{1}$ , S₂, S₃, S₄	S₁, $\bar{S}_{2}$ , S₃, S₄	S₁, S₂, $\bar{S}_{3}$ , S₄	S₁, S₂, S₃, $\bar{S}_{4}$
D₁	0	0	0,75	0	0
D₂	0,73	0,63	0,23	0,86	0,07
D₃	0,27	0,37	0,02	0,14	0,93

Из табл. 2 видно, что наиболее четкая картина в данном примере получается в том случае, когда у больного отсутствует признак S₄, но имеются все остальные признаки P(D₃) = 93%.

В реальных условиях при наличии 100 200 признаков для 30 80 диагнозов подобные расчеты проводятся на ЭВМ с выдачей вероятностей каждого диагноза.

Полученные вероятности сравниваются с некоторым пороговым значением T_j, устанавливаемым в процессе обучения. Если P(D_j) > T_j), то делается вывод о наличии у больного диагноза (обычно T_j > 0,9). В случае, когда P(D_j) < T_j, требуется проведение дополнительных обследований.

Метод Вальда (последовательный статистический анализ)

Для дифференциальной диагностики может быть использован метод Вальда. Он представляет собой последовательную процедуру обследований, при которой достигается выбранный уровень вероятности диагноза. Сущность метода состоит в следующем. Предположим, что требуется установить один из двух возможных диагнозов D₁ и D₂. Сначала проводится обследование по признаку S₁. Предположим далее, что при диагнозе D₁ признак S₁ имеет частот)’ встречаемости P(S₁ | D₁), а при диагнозе D₂ — соответственно P(S₁ | D₂). Если у больного отмечается наличие признака S₁, а при диагнозе D₂ он встречается значительно чаще, чем при D₁, то можно сделать вывод в пользу диагноза D₂.

Таким образом, принимается диагноз D₂, если

$\frac{P\left(S_{1} | D_{2}\right)}{P\left(S_{1} | D_{1}\right)} >A$

где A — верхняя граница, необходимая для принятия решения. В противоположном случае, когда признак S₁ значительно чаще встречается при диагнозе D₁,

$\frac{P\left(S_{1} | D_{2}\right)}{P\left(S_{1} | D_{1}\right)} <B$

где B — нижняя граница отношения, принимается решение в пользу диагноза D₁. Если же отношение вероятностей, называемое отношением правдоподобия, занимает промежуточное положение

$B<\frac{P\left(S_{1} | D_{2}\right)}{P\left(S_{1} | D_{1}\right)} <A$

то требуется провести дополнительное обследование. Тогда проводится обследование по признаку S₁ и, например при его отсутствии, вычисляется отношение

$\frac{P\left(\bar{S}_{2} | D_{2}\right)}{P\left(\bar{S}_{2} | D_{1}\right)}$

При

$\frac{P\left(S_{1} | D_{2}\right)}{P\left(S_{1} | D_{1}\right)} \frac{P\left(\bar{S}_{2} | D_{2}\right)}{P\left(\bar{S}_{2} | D_{1}\right)}>A$

ставится диагноз D₂. Подобным образом используется нижняя граница В и область неопределенности. Если признаки являются зависимыми, то следует определять отношение правдоподобия с учетом результатов предыдущих испытаний (т.е. определять вероятность отсутствия признака S₂ при условии, что имеется признак S₁).

В последовательном анализе границы принятия решения имеют определенный физический смысл.

A = (1 – β) / α; B = β / (1 – α)

где α — вероятность ошибки, при которой больному с диагнозом D₁ устанавливается диагноз D₂; β — вероятность ошибки, при которой больному с диагнозом D₂ устанавливается диагноз D₁. Для сокращения объема обследований рекомендуется проводить сначала обследования по наиболее информативным признакам (т.е. по признакам с наибольшей диагностической ценностью). Уменьшение величины о и ft приводит к уменьшению числа ошибок диагностической системы, но одновременно увеличивает число неопределенных ответов, что на практике весьма нежелательно.

Субъективная мера вероятности

На практике часто встречаются случаи, когда вероятности каких-либо событий из-за отсутствия или очень малого объема статистических данных не могут быть оценены как соответствующие частости. В таких случаях вполне уместно применение субъективных вероятностей³, т.е. оценок, данных человеком на основании его интуиции и опыта. В жизни от врачей мы порой слышим: «вероятность летального исхода для данного пациента равна 80 %» или «для данного результата теста вероятность наличия данного заболевания составляет 30 %». Мнения разных врачей могут различаться. Возможно привлечение группы экспертов, которые оценят значения субъективных вероятностей более точно.

Если таким субъективным образом оценить P(D_j) и P(S | D_j) то, используя теорему Байеса, можно вычислить P(D_j | S) для разных заболеваний. При допущении независимости симптомов

$P\left(D_{j} | S\right)=\frac{P\left(S | D_{j}\right) P\left(D_{j}\right)}{P(S)}$

Footnotes

Гублер Е. В. Информатика в патологии, клинической медицине и педиатрии. — Л.: Медицина, 1990.
Гублер Е. В. Вычислительные методы анализа и распознавания патологических процессов. Л.: Медицина, 1978. 290 с.
Ластед Л. Введение в проблему принятия решений в медицине. — М.: Мир, 1971.