УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК
Том 26 №4 1995
УДК 612.8
А. Т. ТЕРЕХИН, Е. В. БУДИЛОВА
СЕТЕВЫЕ МЕХАНИЗМЫ ФИЗИОЛОГИЧЕСКОЙ РЕГУЛЯЦИИ
Биологический факультет МГУ им. М. В. Ломоносова
Дается обзор основных идей и понятий нового методологического подхода к описанию и пониманию регуляторных процессов в организме — так называемого коннекционистского, или сетевого, подхода. Рассматриваются сетевые модели нервной, иммунной, эндокринной и генной регуляции, вводится представление об организме как о целостной сетевой системе. Предлагается новый подход к регуляции состояния организма, названный авторами ассоциативным управлением, и обсуждаются его возможные применения для коррекции состояния организма.
В течение последних лет, не явно с 1983 г. и явно с 1986, происходило взрывное нарастание исследовательской активности в области, получившей к настоящему времени устойчивое название «нейросетевые исследования» («neural network research»). Оно характеризовалось экспоненциальным, с периодом удвоения 1—2 года, ростом числа публикаций, научных конференций и новых журналов, а также частоты встречаемости в библиографических базах данных ключевых слов типа «нейронные сети» и цитирований основных авторов этого направления [4, 26]. Можно, однако, отметить парадоксальный факт — хотя уже из самого названия данного направления следует, что его первоисточником являются нейрофизиологические исследования, бурный рост нейросетевых исследований в последнее десятилетие относится в основном к развитию математической теории нейроподобных сетей, разработке новых алгоритмов машинной обработки информации, в частности обработки изображений и речи, созданию принципиально новых типов вычислительных машин — нейрокомпьютеров [10]. Доля же нейросетевых работ, связанных непосредственно с физиологической тематикой, относительно невелика. Например, в собранной нами библиографии по нейронным сетям, включающей несколько тысяч названий [14], их всего несколько десятков. Такая ситуация не представляется нормальной и, возможно, объясняется чисто экономическими причинами, связанными с более интенсивным финансированием исследований технической направленности. Нам, однако, кажется, что новые идеи и подходы как общего, так и конкретного характера, разработанные в теории нейронных, или шире, когнитивных сетей, могут быть чрезвычайно полезными для более адекватного описания и понимания сущности многих процессов, протекающих в организме. Данная статья — попытка продвижения в этом направлении.
Мы начнем с описания основных понятий и свойств нейроподобных сетей (п. 1). Затем рассмотрим сетевые модели отдельных регуляторных систем организма — нервной, генетической, иммунной, эндокринной и обоснуем представление о сетевом характере организации организма как целого (п. 2). Далее, в п. 3 будут предложены подходы к управлению состоянием когнитивной сети, основанные на ее свойстве ассоциативного восстановления своих устойчивых состояний, а в п. 4 будут рассмотрены возможности применения этих подходов к управлению состоянием организма.
75
1. Основные идеи и понятия теории нейронных сетей
Суть сетевого подхода состоит в том, что изучаемый объект рассматривается как динамическая сеть связанных между собой и влияющих друг на друга элементов. Оказывается, что даже сети из относительно простых элементов, взаимодействующих по простым правилам, могут иметь очень сложное и разнообразное поведение. Это позволяет использовать сетевые модели для описания таких сложных биологических процессов, как когнитивная деятельность мозга, работа генетического аппарата клетки, функционирование иммунной системы и др.
Исторически сетевые модели в наиболее явном виде впервые были рассмотрены Мак-Каллохом и Питтсом [25], которые ввели понятие формального нейрона и исследовали математически свойства сетей из таких нейронов. Хебб [16] выдвинул гипотезу о механизме формирования межнейронных связей, согласно которой в процессе обучения усиливаются связи между нейронами, одновременно находящимися в возбужденном состоянии. Розенблатт [9] предложил искусственную нейронную сеть, названную им персептроном, которая обладала способностью обучаться распознаванию простых образов. Коффмэн [22] применил сетевой подход для описания работы генетической системы, а Джерн [21] — иммунной. Сильным стимулом к развитию исследований в области динамических сетей послужила работа Хопфилда [19], в которой для исследования свойств искусственных нейронных сетей была применена математическая теория динамических систем, созданная в конце прошлого века А. Пуанкаре и широко используемая в механике, теоретической физике, химической кинетике и других областях.
В этом разделе на примере простой, но эффективной и активно используемой в кибернетике, вычислительной схемы — сети Хопфилда [19] рассматриваются основные понятия теории когнитивных динамических сетей и некоторые их свойства. Описываются два способа обучения сетей — правило Хебба и метод случайного отбора. Некоторые принципиальные ограничения детерминированной сети преодолеваются путем введения в нее стохастичности (машина Больцмана). Другим обобщением сети Хопфилда являются сети с асимметричными связями, допускающие циклические устойчивые состояния. Описывается также процедура разобучения, которая позволяет сети освобождаться от ложных устойчивых состояний. Подчеркивается связь теории когнитивных динамических сетей с общей теорией динамических систем.
1.1. Сеть Хопфидда
Сеть Хопфилда — это просто некоторая формальная вычислительная схема. Однако, поскольку ее структура и функционирование в какой-то степени напоминают структуру и функционирование нервной системы, она называется нейронной сетью и ее работа описывается в терминах когнитивной деятельности мозга. Работа других регуляторных систем реального живого организма будут рассмотрены в следующем разделе. Пока же будем рассматривать сеть Хопфилда просто как искусственную схему, которая может быть реализована, например, на компьютере.
Сеть Хопфилда состоит из некоторого числа N элементов, соединенных между собой связями. Каждый из элементов i характеризуется своим состоянием s(i), a каждая связь некоторого элемента i с другим элементом j характеризуется весом w (i, j). Предполагается, что имеется только два возможных состояния элемента: —1 и 1. Веса же могут быть любыми действительными числами. В общем случае веса w (i, j) и w (j, i) могут быть разными, однако в базовой модели Хопфилда они предполагаются равными: w (i, j) = w (j, i). Кроме того, предполагается, что для всех i выполняется условие w (i, i) = 0, т. е. веса связей элементов самих с собой равны нулю.
Такова структура сети Хопфилда. Ее характерная черта — полносвязанность (это, впрочем, не исключает отсутствия связей между отдельными элементами, поскольку любой из весов может быть равен нулю). Следующий шаг — описание
76
правил изменения сети во времени. Динамику сети определяют два правила: правило изменения весов связей и правило изменения состояний элементов. Динамика изменения весов определяется уравнением
(1)
Смысл этого уравнения, называемого правилом Хебба, состоит в том, что за один шаг времени от t до t +1 вес связи между элементами i и j либо увеличивается на 1, если s (i, t) и s (j, t) находятся в одинаковых состояниях, либо уменьшается на 1, если состояние s (i, t) и s (j, t) противоположны.
Изменение в момент t состояния элемента i определяется значением в этот момент величины
представляющей собой взвешенную сумму сигналов, приходящих к элементу i от всех остальных элементов. Состояние элемента i в момент t + 1 определяется в соответствии с правилом
(2)
т. е. элемент i сравнивает взвешенную сумму с нулем и в зависимости от результата принимает одно из двух своих возможных состояний.
Рассмотрим теперь некоторые свойства сетей, поведение которых определяется правилами (1) и (2). Удобно отдельно рассматривать ситуации, когда меняются только веса при неизменных состояниях элементов (режим 1) и когда меняются только состояния элементов (режим 2). Представим, что состояние элементов отражаются в виде панно из горящих лампочек (состояние элемента равно 1) или негорящих (состояние элемента равно —1). Будем называть «образом» произвольную конфигурацию горящих лампочек на фоне негорящих и допустим, что у нас есть возможность задать и зафиксировать или, как говорят, «предъявить» сети любой образ.
Итак, пусть начальные значения в момент t = 0 всех весов w (i, j) равны нулю и сети предъявлен некоторый образ. В соответствии с правилом Хебба (1) в следующий момент времени t = 1 веса изменятся таким образом, что вес связей между элементами, находившимися в одинаковых состояниях, будет единица, а между находившимися в разных состояниях — минус единица. Если предъявить сети второй образ, то веса связей вновь изменятся. Если два элемента находились в одинаковом состоянии при предъявлении как первого образа, так и второго, то вес связи между ними станет равным 2, а если они в обоих случаях были в противоположных состояниях, то соответствующий вес будет равен —2. Наконец, если при предъявлении одного образа элементы находились в одинаковых состояниях, а при предъявлении другого — в разных, то вес связи между ними окажется равным нулю. Этот процесс можно продолжать и предъявлять сети образ за образом — каждый раз соответственно будут модифицироваться веса связей.
Для выяснения свойств сети с полученными в режиме 1 весами изучим ее поведение в режиме 2 — режиме изменения состояний элементов. Рассмотрим конкретный пример. Пусть сети из 56 элементов, расположенных для наглядности в виде прямоугольной решетки из 8 строк и 7 столбцов и имеющих нулевые начальные веса связей, предъявлены последовательно четыре образа — буквы Е, Н, X и Y. Чтобы понять, как будет вести себя сеть с полученными в результате этих предъявлений весами связей, будем предъявлять ей в режиме 2, т. е. при неизменных весах, различные начальные образы и наблюдать за последующей динамикой этих образов, определяемой уравнениями (2).
На рисунке показано несколько типичных примеров такой динамики. В частности,
77
-t=o
Динамика состояний сети, обученной распознаванию образов Е, Н, X, Y, при предъявлении различных начальных образов в момент t=0
первые четыре начальных образа представляют собой искаженные варианты предъявленных в режиме 1 букв Е, Н, X и Y. Мы видим, что всякий раз от искаженного образа сеть переходит к ранее предъявленному соответствующему неискаженному образу и потом постоянно остается в этом состоянии. Таким образом, в режиме 1 сеть как бы «запоминает» образ в изменениях весов связей, а в режиме 2 может его «вспомнить», если ей предъявить похожий образ, т. е. некоторую «ассоциацию», связанную с этим образом. Соответственно режим 1
78
называют режимом запоминания, или обучения, а режим 2 — режимом воспроизведения, или распознавания.
Последние три примера динамики на рисунке получены при задании случайных начальных образов, не похожих или не очень похожих на образы, предъявленные во время обучения. Тем не менее в одном случае система переходит в состояние, соответствующее одному из этих образов — X. Однако в двух других случаях мы получаем новые образы, которые не предъявлялись сети при ее обучении. Это говорит о том, что в числе устойчивых образов, к которым сеть стремится в режиме распознавания и которые называются ее аттракторами, кроме предъявленных при обучении образов имеются и другие. Часто их называют «ложными» и рассматривают как помехи осуществлению сетью функций ассоциативной памяти. Отчасти это действительно так, и мы еще вернемся к этой проблеме, рассматривая процедуру разобучения.
Однако появление «ложных» образов имеет и положительный аспект, поскольку резко расширяет когнитивные свойства сетей [2] . Действительно, можно заметить, что последние два аттрактора на рисунке не случайны, а как бы составлены из частей образов, предъявленных при обучении, т. е. представляют собой своего рода химеры. Возможность появления таких «химер» наделяет сеть в некотором смысле способностью к «обобщению» и «творческой фантазии». Например, предпоследний «химерический» образ на рисунке можно рассматривать как обобщающий символ для Е и Н, а последний — для X и Y.
Поведение сети Хопфилда в режиме распознавания очень удобно интерпретировать в терминах так называемой «функции энергии», вид которой зависит от значений весов связей и которая определяется формулой
(3)
Аргументом этой функции является вектор состояний элементов, который мы для краткости будем называть состоянием сети и представлять наглядно в виде точки в N-мерном пространстве состояний элементов, Например, в случае сети из двух элементов, состояния которых могут быть любыми действительными числами, пространство состояний будет представлять собой плоскость, а функция энергии — поверхность над этой плоскостью в трехмерном пространстве.
Можно показать, что определяемое уравнениями (2) изменение состояния сети происходит в направлении уменьшения энергии (3). Действительно, пусть, например, элемент i находится в состоянии -1 и Q (i, t) > 0, тогда он должен на следующем шаге, в соответствии с правилом (2), перейти в состояние 1. В то же время, учитывая ( 3) , получаем для приращения энергии при этом переходе
т.е.
(4)
откуда следует, что это приращение действительно отрицательно.
Удобно наглядно представлять изменение состояния сети как движение соответствующей точки в пространстве состояний, подобно тому как это происходит, например, с помещенным на неровную поверхность шариком, который всегда движется в направлении уменьшения своей потенциальной энергии. В точках пространства состояний, соответствующих образам-аттракторам, функция энергии имеет локальные минимумы, поэтому сеть, достигнув любого из таких состояний, остается в нем до тех пор, пока не будет принудительно переведена в
79
новое начальное состояние. Все пространство состояний распадается, таким образом, на области, образующие так называемые бассейны притяжения аттракторов, и динамика сети, установленной в некоторое начальное состояние, полностью зависит от того, в бассейн притяжения какого из аттракторов она попала.
1.2. Генетическое обучение
Рассматривая выше свойства сети Хопфилда, мы предполагали, что ее веса формируются в соответствии с правилом Хебба (1). Однако это не единственный способ их получения. Другой возможный способ обучения сети — случайный отбор. Для его реализации необходимы механизм генерации случайных модификаций весов связей и механизм фиксации тех из них, которые в некотором смысле благоприятны для сети.
Рассмотрим в качестве примера сеть из N + 1 элементов, управляющую поведением некоего гипотетического организма. Пусть первые N элементов (или некоторые из них) играют роль «сенсоров», отражающих состояние внешней среды, а последний — роль «эффектора», одно из состояний которого, скажем, единица, соответствует оценке ситуации как опасной и включает механизм защиты, другое же — оценке ситуации как безопасной и позволяющей выполнять жизненно важные функции, например поиск пищи. Очевидно, что сеть должна максимально правильно оценивать ситуацию, поскольку организм может пострадать как из-за игнорирования внешней опасности, так и из-за недостатка времени на функции жизнеобеспечения. Как обучить сеть правильной оценке ситуации?
Один путь может состоять в использовании правила Хебба. Для его применения необходимо иметь набор учебных ситуаций — (N + 1)-мерных векторов, содержащих как N-мерный образ внешней среды, так и значение (N +1)-й компоненты — ее оценку. То, что мы уже знаем о свойствах сети, позволяет ожидать, что после предъявления ей достаточного числа примеров в режиме обучения она будет способна более или менее успешно решать поставленную задачу оценки ситуации в режиме распознавания.
Такой способ, однако, применим лишь при наличии, так сказать, «примеров с ответами». Если обучающих примеров нет или их недостаточно, то приходится «учиться на ошибках». Такое обучение состоит в том, что веса связей время от времени случайно меняются, но изменения сохраняются только в тех случаях, когда они повышают правильность оценки ситуации. Механизм фиксации положительных изменений естественным образом реализуется, например, в ситуации дарвиновского отбора, когда изменения, приводящие к более «правильному» поведению, имеют большие шансы сохраниться в последующих поколениях благодаря получаемым при этом преимуществам в размножении [24, 29, 30].
Можно предположить, что обучение путем случайного отбора играет основную роль в филогенезе, тогда как для онтогенеза более характерно обучение типа хеббовского.
1.3. Стохастические сети
Поведение сети Хопфилда полностью детерминировано. Однако легко получить стохастический вариант этой сети, называемый машиной Больцмана [17] , если заменить ее элементы, изменяющие свое состояние в соответствии с правилами ( 2) , на их стохастические аналоги, изменяющие состояние случайным образом в соответствии с вероятностями, определяемыми формулами
и
80
или, учитывая (4),
и (5)
где Т — параметр, характеризующий степень стохастичности сети и называемый обычно «температурой».
При очень больших Т вероятности переходов в состояния 1 или —1, определяемые (5), слабо зависят от соответствующих этим переходам изменений энергии и примерно равны 1/2, что говорит о практической независимости динамики сети от рельефа энергетической поверхности.
Наоборот, при Т = 0 динамика машины Еольцмана совпадает с динамикой нестохастической сети Хопфилда, определяемой (2).
Действительно, если, например, элемент i находится в состоянии —1 и Q(i, t) > 0, то имеем при Т ->0, в соответствии с (5),
т. е. элемент i с вероятностью, стремящейся к 1, перейдет в состояние 1. К такому же результату привело бы и применение детерминированного правила (2).
При промежуточных температурах сеть с высокой вероятностью остается в состояниях, соответствующих глубоким минимумам энергии, и относительно легко выходит из состояний, соответствующих мелким минимумам. Это означает, что благодаря введению стохастичности сеть получает способность различать локальные минимумы энергии по степени их выраженности, т. е. способность отличать надежные, многократно встреченные образы, которым соответствуют глубокие минимумы, от случайных.
Возможность свободного случайного блуждания сети в пространстве состояний расширяет возможности нахождения ею более глубоких минимумов энергии, т. е. способствует более успешному решению задач распознавания. Эффективная процедура такого блуждания, названная «отжигом», состоит в том, что поиск начинается при высокой температуре сети, которая постепенно снижается до нуля [23].
Сеть с элементами стохастичности как бы получает внутренний источник
движения. Машина Больцмана, в отличие от нестохастической сети Хопфилда,
достигнув ближайшего локального максимума энергии, уже не обречена находиться в нем до тех пор, пока ее состояние не будет изменено извне, а может
сама выйти из этого состояния [6]. .
1.4. Асимметричные сети
Определяя архитектуру сети Хопфилда, мы приняли в качестве условия, что веса связей между ее элементами симметричны, т. е. w (i, j, t) = w (j, i, t). Что произойдет, если это ограничение снять? Оказывается, что у асимметричной сети появляется новое полезное свойство — такая сеть может иметь не только точечные, но и циклические аттракторы и, соответственно, может запоминать не только отдельные образы, но и последовательности образов.
Для обеспечения возможности запоминания асимметричной сетью последовательности образов изменим правило Хебба (1) так, чтобы в весах связей фиксировались не отношения между состояниями элементов предъявляемого в момент t образа, а отношения между состояниями элементов образа, предъявленного в момент t — 1, и образа, предъявляемого в момент t. Соответствующее обучающее правило запишется в виде следующей формулы:
(6)
Что касается правил, определяющих динамику состояний элементов, предполагается, что она по-прежнему задается уравнениями (2).
81
Очевидно, что все ранее сказанное относительно возможности и целесообразности обучения сети путем случайного отбора и введения в ее динамику стохастичности в равной степени относится и к асимметричным сетям.
К сожалению, интерпретация динамики сети в терминах движения состояния в направлении антиградиента функции энергии (3) на случай асимметричной сети непосредственно не переносится. Действительно, как мы можем возвратиться в прежнее состояние, если на каждом шаге энергия может только уменьшиться?
Можно, однако, использовать другой, более общий способ наглядного описания динамических свойств сети — векторное поле скоростей изменения состояния, заданное в пространстве состояний. Это поле легко строится по функции энергии, поскольку в каждой точке пространства состояний оно равно просто антиградиенту функции энергии. Поэтому в случае симметричных сетей мы можем наряду с функцией энергии использовать для описания динамики также и поле скоростей. Однако в случае несимметричных сетей, которые могут иметь циклическую динамику, годится лишь описание в терминах поля скоростей.
Более важно, однако, подчеркнуть, что в обоих случаях пространство состояний делится на непересекающиеся части, соответствующие бассейнам притяжения разных аттракторов, и динамика сети определяется ее движением в соответствии с полем скоростей по направлению к аттрактору, в бассейне притяжения которого находится ее состояние.
Отметим еще, что полное поле скоростей сети не исчерпывается полем скоростей в пространстве состояний элементов. Поскольку веса связей также изменяются в зависимости от состояний элементов (а через них, следовательно, и в
зависимости от значений других весов), то в принципе можно рассматривать поле
скоростей в объединенном пространстве состояний элементов и весов связей.
Далее, однако, мы ограничимся ссылками лишь на поле скоростей в пространстве
состояний, предполагая, что на рассматриваемом промежутке времени значения
весов существенно не меняются.
Поделитесь с Вашими друзьями: |