Модели в медицине
Введение
Во многих задачах науки и практики, в которых присутствует неопределенность, успешно применяются стохастические математические модели, основанные на вероятностно-статистических методах (военные приложения, экономика, надежность сложных систем и т.д.). Широкое применение такие модели должно находить в медицине и в здравоохранении, где, во-первых, высока неопределенность условий протекания наблюдаемых процессов, и, во-вторых, возможно накопление обширной информации об их результатов.
Сразу следует подчеркнуть, что математические модели не могут заменять содержательный (естественнонаучный) анализ закономерностей, имеющих место в наблюдаемом явлении, но позволяют в результате формализации получаемых результатов найти скрытые от наблюдателя взаимосвязи между участвующими в нем факторами.
вопросы о целесообразности применения модельного подхода в двух областях медицины: в медицинской диагностике и в сравнительной оценке эффективности медицинских методов, применяемых в приложении к болезням с летальным исходом. На первом этапе с этой целью используются чисто вероятностные модели; фигурирующие в них распределения вероятностей считаются известными исследователю. В дальнейших исследованиях (если они окажутся целесообразными) предполагается использование их стохастическое представление, включающее методы математической статистики.
1. МОДЕЛИ МЕДИЦИНСКОЙ ДИАГНОСТИКИ
Начнем с задач медицинской диагностики, которые сравнительно легко формулируются в терминах математических моделей.
Суть медицинской диагностики обычно состоит в определении (распознавании) одного из состояний пациента из возможного конечного набора его состояний, среди которых содержится и состояние «здоров». Это распознавание осуществляется по результату наблюдения заданной совокупности признаков, связанных с состояниями объекта.
В простых случаях эта связь детерминирована, т.е. каждому состоянию пациента соответствуют вполне определенные значениями наблюдаемых признаков. Это означает, что между состояниями пациента и их признаками существует жесткая логическая зависимость, позволяющая однозначно устанавливать вид болезни (или ее отсутствие среди заданного их набора).
В более интересных и практически важных случаях связь между состояниями пациента и наблюдаемыми признаками имеет вероятностный характер: совокупность признаков представляет собой случайный вектор, имеющий для различных состояний пациента различные распределения вероятностей. При этом предполагается, что эти распределения получены в результате обработки больших объемов данных и потому достоверно известны (выполнение этого условия представляет собой непростую практическую проблему, которую мы здесь, однако, опускаем).
Переход к вероятностным моделям диагностики, о которых далее идет речь, приводит к появлению конечных вероятностей ошибочных решений, при которых вывод о состоянии пациента оказывается неверным. Наша задача состоит в построении вероятностных моделей, в которых вероятности таких ошибочных выводов в определенном (раскрываемом ниже смысле) минимальны.
Введем определения и обозначения.
Обозначим n число классов возможных альтернативных состояний пациента (объекта), образующих множество n-1 различных эаболеваний и одно здоровое состояние, n ³ 2. Для этого множества и его элементов (классов) введем обозначения (H1 – здоровое состояние объекта).
Измеряемые параметры объекта Y1,…, Ym образуют (в общем случае ––векторный) признак Y = (Y1,… Ym)¢. Состав компонент вектора Y для всех объектов примем одинаковым (это всегда можно получить, образуя обобщенный вектор – признак). Вместе тем, рассматривая Y как случайный вектор, обычно предполагается, что его распределения (т.е. его условные распределения) для различных классов объектов не совпадают.
Напомним [1], что распределение вероятностей случайного вектора в общем случае представляет собой совместное распределение вероятностей совокупности его компонент, часто имеющее на практике смешанный характер, поскольку вектор Y может содержать непрерывные и дискретные компоненты. Для простоты изложения мы, однако, будем постоянно предполагать, что вектор Y для каждого класса Hi имеет непрерывное условное распределение, т.е. обладает условной плотностью распределения (известной наблюдателю – диагностику).
Предполагается, что до получения наблюдателем диагностических данных (т.е. информации о значении признака Y = y для обследуемого объекта), каждому его состоянию Hi можно приписать определенную доопытную (априорную) вероятность P(Hi), характеризующую распространенность данного состояния. Полагая, что каждый объект находится в одном и только в одном состоянии, получим
После получения значения y признака Y для обследуемого объекта, наблюдатель может найти вероятности состояний наблюдаемого объекта для каждого, применяя формулу Байеса [1]
.
Вероятности носят название апостериорных (послеопытных) вероятностей.
Вернемся к вопросу о вероятностях ошибочных решений наблюдателя и о построении оптимальных решающих правил для установления им классов наблюдаемых объектов.
Далее мы будем рассматривать. в основном, случай n = 2, т.е. двухальтернативную задачу диагностики: («здоров» или «имеет определенную болезнь»). Вопросы многоальтернативной диагностики и связанные с ней трудности кратко обсуждаются ниже. Там же мы коснемся случая, когда векторный признак Y имеет переменную размерность, возрастающую по мере необходимости.
Наша задача при n = 2 состоит в построении правила, которое каждому значению признака, Y = y, обнаруженного у объекта, относит его состояние к одному из двух классов: H1 («объект здоров») или H2 («объект болен»). Такое правило назовем решающим правилом. Построению решающего правила соответствует обычно разбиение множества Y всех значений признака Y на две непересекающихся области Y1 и Y2: Y = Y1 È Y2, Y1 Ç Y2 = Æ, и выполнению предписаний (импликаций)
y Í Y1 Þ d1 (решение о том, что имеет место событие H1 (объект здоров);
y Ì Y2 Þ d2 (решение о том, что имеет место событие H2 – объект болен).
Заметим, что в некоторых случаях применяются более сложные рандомизированные решающие правила (которые не имеют , однако, для практики принципиального значения и здесь не рассматриваются). Решающее правило можно, следовательно, рассматривать как функцию значения признака d = d(y) с значениями d1 и d2, представив его в виде
Множеству различных разбиений Y = Y1 È Y2 соответствует множество решающих правил d(y), среди которых следует выбрать то, которое приводит к наиболее достоверному решению о состоянии пациента. Ясно, что эта достоверность определяется свойствами распределения признака и имеет следующий смысл.
Пусть решающее правило d(y) соответствует разбиению Y = Y1 È Y2. Возможны два вида ошибочных решений: 1)здоровый пациент принимается больным (ошибка первого рода); 2)больной пациент принимается здоровым (ошибка второга рода). Эти ошибки имеют, соответственно, следующие вероятности
и
(здесь приняты обозначения: Y1 = Y1, Y2 = Y2).
В частных простых случаях область всех значений Y можно разбить на две области Y1,и Y2, для которых имеют место равенства
=0 и =0,
т.е. вероятности ошибок первого и второго родов равны нулю и состояние пациента определяется однозначно; это имеет место, когда условные плотности распределения признака не пересекаются, (см. рис. 1 для скалярного признака Y; плотность распределения 1 соответствует состояниюH1, плотность распределения 2 – состоянию H2).
Нас, однако, интересуют чаще встречающиеся и более сложные случаи, когда такая безошибочность решения невозможна и вероятности a и b не равны нулю, т.е. условные распределения пересекаются. На рис.2 приведен такой случай для скалярного признака при некотором произвольном разбиении Y = Y1 È Y2 при разделяющем значении признака Y = y*: Y1 = {y: y £ y*}, Y2 = {y: y > y*}. При этом получаем
.
Значения a и b взаимозависимы, поскольку оба зависят от разбиения Y = Y1 È Y2. Это приводит к тому, что найти такое решающее правило, которое одновременно доставляло бы безусловные (независящие друг от друга) минимальные значения a и b, оказывается невозможным. Можно, однако, получить значения условного минимума одной из этих вероятностей (например – b) при фиксированных значениях другой (a), т.е. среди всех решающих правил d = d(a) при каждом заданном a найти такое, при котором b достигает минимального значения
;
типичный вид такой зависимости приведен на рис.3.
Рис.3
Иногда вместо вероятности ошибки второго рода b используется вероятность j = 1 - b правильной классификации объекта второго класса (решение о том, пациент болен, когда он действительно болен). Тогда вместо функции получаем зависимость
которую иногда называют рабочей характеристикой признака, определяющей его классифицирующую способность при различных значениях a. Величину именуют также мощностью решающего правила при данном a.
На рис.4 приведены примеры рабочих характеристик j1(a),j2(a),j3(a) для трех признаков Y1, Y2 и Y3 (графики 1, 2, 3), из которых следует, что классифицирующая способность признака Y3 выше, чем признака Y2 при всех значениях a (j1(a) > j2(a) для всех значениях a, за исключением тривиальных случаев a = 0, a = 1). Признаки Y1 и Y2 с пересекающимися рабочими характеристиками в этом смысле несопоставимы, поскольку при a < a*эффективнее оказывается признак Y1, а при a >a* – признак Y2
Алгоритм построения рабочей характеристики признака опирается на лемму Неймана- Пирсона [3], позволяющую находить для каждого значения a решающее правило, максимизирующее значение вероятности j.
Согласно этой лемме такому решающему правилу соответствует определяемое функцией отношения правдоподобия
разбиение множества значений признака Y на две области согласно схеме
и , Y = W1a + W2a,
где La отвечает условию
.
Рассмотрим подробнее, в чем выражаются свойства вероятностных правил принятия решений в их приложении к задачам медицинской диагностики.
Итак, в общем случае при двухальтернативной диагностике принятие каждого решения сопряжено с возможностью допустить одну из двух ошибок: принять здорового пациента за больного (ошибка первого рода) или посчитать здоровым больного (ошибка второго рода); вероятности этих ошибок равны, соответственно, a и b = 1-j. Для каждого конкретного признака Y вероятности этих ошибок могут варьироваться диагностиком путем выбора порогового значения функции отношения правдоподобия La, находясь при этом в монотонно убывающей взаимосвязи: с ростом одной из них вторая снижается.
В связи с этим возникает вопрос о выборе такого La, при котором a и b принимают приемлемые значения (в рамках указанной возможности их передела).
В тех приложениях, где последствия ошибок могут быть выражены штрафами, измеряемыми общей мерой (например, рублями), эта задача решается минимизацией среднего штрафа [3]
где Ca, Сb – штрафы за ошибки первого и второго рода; минимизация C выполняется по a с учетом зависимости b = b(a).
Такой подход, возможный, например, в экономике, вряд ль плодотворен в медицине, где последствия ошибок первого и второго рода обычно трудно сопоставимы (в случаях, например, излишнего пребывания здорового пациента в больнице или в выписке из нее невылеченного пациента). Поэтому в рассматриваемых медико-диагностических задачах выбор соотношения между допустимыми значениями ошибок первого и второго рода должен опираться на содержательные соображения диагностика.
Рассмотрим отдельную скалярную компоненту Y1 признака Y, т.е. одномерный признак Y1. Его индивидуальная классифицирующая способность выражается содержащейся в нем информации о состоянии объекта, которая определяется различием значений априорной и апостериорной вероятностей P(Hi) и
.
Так, индивидуальная классифицирующая способность признака Y1 равна нулю, если для всех Hi имеют место тождества (по y1) . Нетрудно убедиться, что это тождество эквивалентно тождественному равенству условных распределений признака Y1 для обоих состояний пациента: Будем для краткости называть признак Y1, имеющий индивидуальную классифицирующую способность, нулевым, а признак Y1, для которого указанные свойства не выполняются – ненулевым. Эту терминологию ниже мы будем применять и в общем случае векторного признака.
Пусть признак Y1 – нулевой. Означает ли это, что включение его в качестве компоненты в многомерный признак Y бессмысленно, т.е. не приводит к увеличению классифицирующей способности последнего?
Оказывается, что это не так: компонента признака с нулевой индивидуальной классифицирующей способностью, будучи использована в группе компонент признака Y, может способствовать существенному повышению их групповой классифицирующей способности, т.е. классифицирующей способности Y.
Приведем пример. Пусть двухмерный признак Y = (Y1, Y2) имеет компоненты Y1, Y2 с условными совместными плотностями распределения . Для апостериорного распределения состояния пациента Hi имеем
При ( признак Y является нулевым, в противном случае – ненулевым. Допустим далее, что при каждом Hi компоненты Y1, Y2 независимы друг от друга, т.е.
где – частные распределения компонент Y1 и Y2
(такую независимость компонент называют их условной независимостью). Тогда
.
Если обе компоненты Y1 и Y2 нулевые, то имеют место тождества , т.е. и векторный признак Y = (Y1, Y2) является нулевым.
Допустим теперь, что компоненты признака Y1 и Y2 условно независимы при H1, но зависимы при H2 (оставаясь нулевыми). Тогда, ввиду неравенства получаем
,
т.е. признак Y имеет ненулевую эффективность, причем уровень его классифицирующей способности определяется зависимостью между его нулевыми компонентами.
Из всего этого следует простой вывод: классифицирующая способность векторного признака определяется не только и не столько индивидуальной классифицирующей способностью его компонент, но и существованием зависимости между ними. Следует, однако, при этом подчеркнуть, что использование этой классифицирующей связи возможно лишь тогда, когда в обучающей выборке значений признака сохраняется информация о связи между его компонентами, т.е. при синхронном их измерении при формировании этой выборки (под обучающей выборкой понимается набор значений признака, полученный в предшествующих наблюдениях и используемый для оценки параметров и свойств формируемой вероятностной модели диагноза).
Синхронность измерений векторного признака Y, образующих обучающую выборку, означает, что каждое его значение (все значения его компонент) принадлежит одному и тому же пациенту и получено в одно и то же операционное время.
Мы рассмотрели сравнительно простой случай двухальтернативного медицинского диагноза. Как уже говорилось, возможны, однако, задачи диагностического выбора одного из n, n > 2, состояний пациента (многоальтернативный диагноз), т.е. , n > 2.
Обозначим dij ошибочное решение, при котором истинное состояние пациента Hi принимается как состояние Hj, i ¹ j; назовем такую ошибку ошибкой (i,j) – го рода. Число возможных ошибочных решений составляет теперь n(n-1) > 2 и выбор оптимального диагностического решающего правила существенно усложняется как по его смыслу, так и по практической реализации.
Рассмотрим, к примеру, один из вариантов многоальтернативного диагноза (насколько такой вариант имеет практический смысл должен судить специалист – диагностик). Пусть по некоторым содержательным соображениям можно допустить, чтобы вероятности ошибок (i,j)-го рода для всех i,j, кроме i = k, j = l, , удовлетворяли ограничениям , где заданные числа, и при этих условиях вероятность ошибочного решения достигала минимума. Такой вариант задачи (который подробно здесь не рассматривается) приводит к многомерному методу Неймана-Пирсона.
Другим интересным развитием модельного представления медицинской диагностики является разработка моделей последовательного диагноза, при котором принятие решения о состоянии пациента осуществляется в результате последовательного наращивания размерности признака Y, начиная с простых компонент. Такой подход широко используется на практике (например, при онкологическом диагностировании). Моделирование последовательного диагноза может, например, преследовать цель получения максимальной достоверности диагноза при заданных ограничениях на применение компонент, требующих высоких материальных и физических затрат (например – на выполнение операции биопсии при онкологическом диагностировании).
2. МОДЕЛИ ОЦЕНКИ ЭФФЕКТИВНОСТИ ЛЕЧЕБНЫХ МЕТОДОВ
Вторым кругом задач медицинской практики, в котором может оказаться полезным применение вероятностных математических моделей, является оценка эффективности, получаемой от применения некоторого медицинского метода (например, от применения нового лекарства). Часто эта эффективность выражается средней продолжительностью жизни пациента при применении к нему данного метода (в сравнении с этой характеристикой, получаемой, когда этот метод не применялся). Используя среднюю продолжительность жизни как основной критерий эффективность исследуемого метода, мы чрезмерно упрощаем задачу, поскольку эта величина (в теории вероятностей – математическое ожидание MT случайной величины T – продолжительности жизни пациента) не исчерпывает ее свойств и не всегда может претендовать на роль ведущего критерия при оценке исследуемого метода.
Пример такой ситуации иллюстрирует рис.5, на котором приведены плотности распределения f1(t) и f2(t) (кривые 1 и 2) для продолжительности жизни пациента T1 и T2 при двух конкурирующих методах лечения соответственно, с равными значениями математического ожидания (MT1 = MT2 = m =5), но существенно различающиеся по дисперсиям (DT1 >> DT2). Очевидно, что из этих двух методов второй предпочтительней, поскольку для него имеет место более высокая (чем для первого метода) вероятность дожить до некоторого значения t* (t* < m). Более того, второй метод может быть предпочтительней первого и в случае, когда MT1 > MT2. Так, для пациента вероятность дожить до заданного возраста (например – до пенсии) может иметь большее значение, чем средняя продолжительность жизни некоторой совокупности пациентов. В подобных случаях для оценки эффективности
fi(t)
методов могут использоваться многокритериальные модели, в которых присутствуют критерии, имеющие субъективный смысл. Так, например, для оценки эффективности метода с позиции пациента может служить критерий K, состоящий из двух требований: а) ограниченноcти снизу вероятности достижения пенсионного возраста (частный критерий K1) и б) максимизации средней продолжительности жизни при условии выполнении критерия K1 (частный критерий K2). Заметим, что размерность критерия зависит от характера распределения продолжительности жизни (точнее от размерности его параметров).
Возвращаясь к вопросу об использовании в качестве одномерного критерия эффективности средней продолжительности жизни, обратим внимание на его ущербность как оценки эффективности метода лечения, поскольку он не отражает качества жизни пациента; высокое значение этого критерия может быть результатом использования средств, направленных на всемерное продление продолжительности его физиологической жизни при игнорировании качества жизни, т.е. без учета приносимой ею пациенту и обществу удовлетворения и пользы. С этой точки зрения, использование для характеристики здоровья общества величина средней продолжительности жизни его членов может оказаться ошибочным, характеризуя высокую бюджетную поддержку неработающих пенсионеров за счет бюджетных инвестиций в производящие секторы экономики, науки и культуры. Впрочем, этот тезис заслуживает более детального изучения и моделирования.
ЛИТЕРАТУРА
-
Натан А.А., Горбачев О.Г., Гуз С.А. Теория вероятностей: Учеб. пособие. –М.: МЗ Пресс – МФТИ, 2007. –253 с
-
Натан А.А., Горбачев О.Г., Гуз С.А. Основы теории случайных процессов: Учеб. пособие. –М.: МЗ Пресс – МФТИ, 2003. –168 с
-
Натан А.А., Горбачев О.Г., Гуз С.А. Математическая статистика: Учеб. пособие. –М.: МЗ Пресс – МФТИ, 2004.–158 с
Натан Андрей Александрович
9.01.2008г
Поделитесь с Вашими друзьями: |