Успехи физиологических наук, 2024, № 3
научный журнал
Покупка
Новинка
Тематика:
Анатомия и физиология человека
Издательство:
Наука
Наименование: Успехи физиологических наук
Год издания: 2024
Кол-во страниц: 126
Дополнительно
Тематика:
ББК:
УДК:
ОКСО:
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Ɋɨɫɫɢɣɫɤɚɹ ɚɤɚɞɟɦɢɹ ɧɚɭɤ ɍɋɉȿɏɂ ɎɂɁɂɈɅɈȽɂɑȿɋɄɂɏ ɇȺɍɄ Ɍɨɦ ʋ ɂɸɥɶ±Ⱥɜɝɭɫɬ±ɋɟɧɬɹɛɪɶ ɀɭɪɧɚɥ ɨɫɧɨɜɚɧ ɜ ɹɧɜɚɪɟ ɝ ȼɵɯɨɞɢɬ ɪɚɡ ɜ ɝɨɞ ,661 ɀɭɪɧɚɥ ɢɡɞɚɟɬɫɹ ɩɨɞ ɪɭɤɨɜɨɞɫɬɜɨɦ Ɉɬɞɟɥɟɧɢɹ ɮɢɡɢɨɥɨɝɢɱɟɫɤɢɯ ɧɚɭɤ ɊȺɇ Ƚɥɚɜɧɵɣ ɪɟɞɚɤɬɨɪ Ʌɉ Ɏɢɥɚɪɟɬɨɜɚ Ɂɚɦɟɫɬɢɬɟɥɢ ɝɥɚɜɧɨɝɨ ɪɟɞɚɤɬɨɪɚ ɅȻ Ȼɭɪɚɜɤɨɜɚ Ƚɂ Ʌɨɛɨɜ Ɉɬɜɟɬɫɬɜɟɧɧɵɣ ɫɟɤɪɟɬɚɪɶ ɪɟɞɤɨɥɥɟɝɢɢ ȺɆ Ɇɟɥɶɤɭɦɹɧɰ Ɋɟɞɚɤɰɢɨɧɧɚɹ ɤɨɥɥɟɝɢɹ ɇɉ Ⱥɥɟɤɫɚɧɞɪɨɜɚ Ɏɂ Ⱥɬɚɭɥɥɚɯɚɧɨɜ ɉɆ Ȼɚɥɚɛɚɧ ɘɉ Ƚɟɪɚɫɢɦɟɧɤɨ ɘȼ ȿɝɨɪɨɜ ɋɋ Ʉɨɥɟɫɧɢɤɨɜ ȼȻ Ʉɨɲɟɥɟɜ ȿȺ Ʉɪɚɫɚɜɢɧ ɘȼ ɇɚɬɨɱɢɧ ɆȺ Ɉɫɬɪɨɜɫɤɢɣ Ɉɗ ɋɨɥɨɜɶɟɜɚ ȼȺ Ɍɤɚɱɭɤ ȼɉ ɒɢɪɢɧɫɤɢɣ Ɂɚɜ ɪɟɞɚɤɰɢɟɣ Ɇȼ Ⱥɪɬɨɛɨɥɟɜɫɤɚɹ Ⱥɞɪɟɫ ɪɟɞɚɤɰɢɢ Ɇɨɫɤɜɚ Ʌɟɧɢɧɫɤɢɣ ɩɪɨɫɩɟɤɬ ɞ (PDLO PDUDDUWRERO#\DQGH[UX Ɇɨɫɤɜɚ ФГБУ «Издательство «Наука» Ɋɨɫɫɢɣɫɤɚɹ ɚɤɚɞɟɦɢɹ ɧɚɭɤ Ɋɟɞɤɨɥɥɟɝɢɹ ³ɍɫɩɟɯɢ ɮɢɡɢɨɥɨɝɢɱɟɫɤɢɯ ɧɚɭɤ´ ɫɨɫɬɚɜɢɬɟɥɶ
СОДЕРЖАНИЕ ТОМ 55, номер 3, 2024 Структурно-функциональная организация зрительной системы в обеспечении целенаправленной деятельности Ю. Е. Шелепин, Е. Ю. Шелепин, В. М. Бондарко, В. Н. Чихман, Д. В. Бондарко 3 Вызванный ответ мозга человека на начало движения звука (motion-onset response) Л. Б. Шестопалова, В. В. Семенова, Е. А. Петропавловская 22 Ксантиноксидоредуктаза: структура, распространение и физиологическая роль С. А. Бедина, Е. Э. Мозговая, С. С. Спицина, М. А. Мамус, А. С. Трофименко 45 Рак и туберкулез легких: обзор ключевых особенностей молекулярных механизмов сочетанной патологии Г. М. Агафонов, Г. Г. Кудряшов, Ю. С. Крылова, Т. С. Зубарева, И. М. Кветной, П. К. Яблонский 58 Аутофагия в нервной системе: общие принципы и специфические функции А. В. Чурилова 75 Нейрореабилитация постинсультных двигательных дисфункций с помощью спинальной электростимуляции Ю. К. Столбков, Ю. П. Герасименко 94 Ионные каналы TRPM8, холод и головная боль: данные экспериментальных и клинических исследований А. Ю. Соколов, Я. Б. Скиба, О. А. Любашина 112
Contents Vol 55, No 3, 2024 Structural-Functional Organization of the Visual System in Ensuring Goal-Directed Activity Yu. E. Shelepin, E. Yu. Shelepin, V. M. Bondarko, V. N. Chikhman, D. V. Bondarko 3 Brain Response to Sound Motion Onset in Human L. B. Shestopalova, V. V. Semenova, E. A. Petropavlovskaia 22 Xanthine Oxidoreductase: Structure, Distribution and Physiological Role S. A. Bedina, E. E. Mozgovaya, S. S. Spitsina, M. A. Mamus, A. S. Trofimenko 45 Lung Cancer and Pulmonary Tuberculosis: Key Features of Molecular Mechanisms of Concomitant Disease G. M. Agafonov, G. G. Kudriashov, U. S. Krylova, T. S. Zubareva, I. M. Kvetnoy, P. K. Yablonskiy 58 Autophagy in the Nervous System: General Principles and Specific Functions A. V. Churilova 75 Neurorehabilitation of Post-Stroke Motor Dysfunctions Using Spinal Electrostimulation Yu. K. Stolbkov, Yu. P. Gerasimenko 94 TRPM8 Channels, Cold and Headache: Data of Experimental and Clinical Studies A. Y. Sokolov, I. B. Skiba, O. A. Lyubashina 112
УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК, 2024, том 55, № 3, с. 3–21 УДК 612.821 СТРУКТУРНОФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ ЗРИТЕЛЬНОЙ СИСТЕМЫ В ОБЕСПЕЧЕНИИ ЦЕЛЕНАПРАВЛЕННОЙ ДЕЯТЕЛЬНОСТИ © 2024 г. Ю. Е. Шелепинa, *, Е. Ю. Шелепинa, **, В. М. Бондаркоa,*** В. Н. Чихмана, ****, Д. В. Бондаркоa,***** аФедеральное государственное бюджетное учреждение науки Институт физиологии им. И.П. Павлова РАН, Санкт-Петербург, 199034 Россия *e-mail: shelepin-yuri@infran.ru **e-mail: shelepiney@infran.ru ***e-mail: vmbond@gmail.com ****e-mail: chikhmanvn@infran.ru *****e-mail: dmvb8@mail.ru Поступила в редакцию 29.04.2024 г. После доработки 21.06.2024 г. Принята к публикации 25.06.2024 г. Представлен обзор результатов полувековых исследований зрительной системы как иерархической структуры – многоканальной, многослойной "пирамиды", каждый слой которой имеет различное пространственно-временное разрешение, но в совокупности обеспечивает инвариантное описание изображений для их классификации, принятия решений, организации движения глаз и поиска цели. Проведен анализ многоканальной организации зрительной системы человека как максимально эффективной и наиболее экономичной. Выделены уникальные по морфологическим и функциональным характеристикам системы "перископического и телескопического зрения", обеспечивающие перевод взора и распознавание при поиске и достижении цели. Модели пирамидальной организации зрительной системы оправдали свое существование, оказав исключительное влияние на развитие инженерных решений по конструированию распознающих систем, работающих в реальном масштабе времени, созданию искусственных нейронных сетей. Ключевые слова: зрительная система, глазодвигательные механизмы, фовеа, фовеолита, многоканальная модель, модель пирамиды, модель модулей, пространственно-частотный анализ DOI: 10.31857/S0301179824030017 EDN: BCBSFY ВВЕДЕНИЕ При том, что модели пирамиды создавали для решения сугубо инженерных задач по уменьшению избыточности в передаче и обработке информации об изображениях, в их основу закладывали представления об архитектуре зрительной системы человека и постоянно с ней сравнивали в процессе корректировки и развития. Цель данной статьи – представление итогов проделанной работы и обоснование применения многоканальной, а именно пирамидальной модели зрительной системы, в инвариантном описании объектов, сегментации сцены и в организации движения глаз. Сначала остановимся на кратком описании зрительного анализатора и на обработке изображений в первичных отделах зрительной системы. Принцип многоканальной организации зрительной системы наиболее наглядно демонстрирует пирамидальная модель, согласно которой зрительная система организована в виде многоуровневой структуры иерархических матриц, слои которых образованы рецептивными полями разных нейронов, имеющих различные функциональные свойства, а именно пространственные и временные характеристики. В данном обзоре рассмотрим основные положения этой модели, и представим ее обоснования. Замечательное свойство пирамидальной модели заключается в том, что она наглядно отображает роль зрительной системы в обеспечении целенаправленной деятельности человека. 3
ШЕЛЕПИН и др. АРХИТЕКТУРА СЕТЧАТКИ КАК ПРЕДПОСЫЛКА ПИРАМИДАЛЬНОЙ ОРГАНИЗАЦИИ ЗРИТЕЛЬНОГО АНАЛИЗАТОРА Оптика глаза формирует изображение на сетчатке. Основные участки сетчатки имеют примерно следующие диаметры: фовеолита – 0.1 мм (0.3 угл. град); фовеола — зона диаметром 0.3 мм (1.0 угл. град); фовеа – 1.5 мм (5 угл. град.); парафовеа – 2.5 мм; макула – 5 мм – округлая зона, почти достигающая диска зрительного нерва. Далее располагаются экваториальный пояс и параоральный пояс по краю сетчатки [20, 21, 41, 74, 75, 88, 146]. Нужно отметить, что размеры этих участков у разных индивидуумов немного отличаются и это сказывается на функциональных возможностях зрительной системы [9]. В данном обзоре обратим особое внимание на фовеолиту. Рассмотрим некоторые особенности восприятия при наблюдении объектов центральной частью сетчатки – фовеолитой. Фовеолита участвует в обработке самых мелких деталей изображений, для чего и осуществляется перевод взора на интересующие наблюдателя участки поля зрения. Ограничение, вносимое на формирование изображений на сетчатке при наблюдении на пределе разрешения, определяется функцией рассеяния точки оптической системы глаза [72, 73]. Центр диска Эйри на половине высоты функции рассеяния оптики глаза в фовеолите перекрывает 7 рецепторов [21]. Для установления и подтверждения этой закономерности были проведены эксперименты по восприятию точечных изображений, расположенных на различном расстоянии друг от друга. Испытуемый с остротой зрения около 2.0 (измеренной по таблице Головина – Сивцева) при расстоянии между центрами пятнышек до 1.12 угл. мин видел одно пятнышко. Начиная с расстояния 1.12 угл. мин, этому наблюдателю казалось, что он видит не точку, а штрих. Он мог достаточно точно определить ориентацию штриха. При расстоянии в пределах от 1.47 до 1.7 угл. мин у него возникла неустойчивость восприятия — появлялось кажущееся мерцание либо краев штриха, либо его центра. При расстоянии 2.35 угл. мин между центрами пятен было уверенное различение раздельного расположения пятен. Полученные нами данные позволили предположить, что элементом восприятия изображений является не отдельно взятый рецептор, а их совокупность, состоящая из 7 рецепторов: один рецептор в центре под функцией рассеяния точки и шесть рецепторов в его гексагональном окружении [21]. Эта группа рецепторов (гексагон) является элементом разбиения изображений. По угловым размерам гексагон подогнан под центральную часть рецептивных полей ганглиозных клеток сетчатки, представленных в фовеолите. В центре сетчатки, в фовеолите, функция рассеяния точки оптической системы глаза минимальна, а к периферии сетчатки она расширяется. Размер “гексагона” рецепторов соответствует эффективной части функции рассеяния в центре сетчатки в фовеолите. Фовеолита – вход самого высокочастотного канала. Каналы сохраняют представительство сетчатки вплоть до зрительной коры: в стриарной, в пара- и в перистриарной коре. Оптика глаза согласована с упаковкой рецепторов. Гексагональное мозаичное строение рецепторов сетчатки неоднородно. В центре сетчатки, в фовеолите, расположены самые мелкие и наиболее плотно упакованные рецепторы. Именно эта область сетчатки определяет такую важную характеристику как острота зрения. Острота зрения неизменна только в пределах фовеолиты. Фовеолита обеспечивает самое высокое разрешение при зрительном восприятии. Это так называемое “телескопическое зрение”. Заметим, что и вблизи, благодаря аккомодации хрусталика, самое высокое разрешение обеспечивает также фовеолита. Больше фовеолиты по размеру фовеола, в ней нет палочек, нет капилляров. От фовеолярных ганглиозных клеток сетчаток каждого глаза аксоны идут в оба полушария [20, 88, 146]. На рис. 1 показано взаимное расположение фовеа, фовеолы и фовеолиты. Вверху этого рисунка (рис. 1а) дана схема изменения плотности упаковки рецепторов и их толщины. Структура изменения толщины сетчатки хорошо видна на срезе, полученном с помощью оптико-когерентной томографии (ОКТ) через центр фовеа, что показано на рисунке 1б. Зависимость изменения фовеолярной остроты зрения от эксцентриситета и срез центральной части сетчатки представлены на рисунке 1в [8—10]. На рисунке 1г показана известная “зона нечувствительности сетчатки”, нечувствительности перевода взора к смещению стимула [18, 29]. Эта “зона нечувствительности” соответствует по угловым размерам фовеолите, так как это однородная зона с одинаковым и максмальным разрешением в своих пределах. На рисунке 1в представлена зависимость остроты зрения от эксцентриситета в центральной части сетчатки [120]. На этой кривой зависимости остроты зрения от эксцентриситета хорошо видно плато, соответствующее расположению фовеолиты. Если в пределах фовеолиты, области с одинаковой и самой высокой остротой зрения, смещать стимул, то нет необходимости перевода взора на этот стимул, т.е. это – “зона нечувствительности”. Последующая многоуровневая организация зрительной системы учитывает неоднородность рецепторов на сетчатке. Природа не смогла создать УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК том 55 № 3 2024
СТРУКТУРНОФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ ЗРИТЕЛЬНОЙ СИСТЕМЫ 5 ( ) а ( ) б 405 м ( ) в Фовеа Фовеола Фовеолита 1.0 0.5 Острота зрения 120 60 36 12 0 12 36 60 0 Е – угл. мин. ( ) г Фовеолита 100 80 60 40 20 Вероятность рефлекса, % –12 –8 –4 0 4 8 12 Смещение точки фиксации, в угл. мин. Рис. 1. Архитектура сетчатки и ее функция – острота зрения, организация последующего движения глаз: а – схема гексагональной упаковки рецепторов в центре сетчатки; б – оптико-когерентная томография сетчатки: изображение среза сетчатки по центру фовеолы [8, 9, 10]; в – зависимость остроты зрения от эксцентриситета (Е) в центральной части сетчатки [120]; г – вероятность поворота глаза в зависимости от эксцентриситета появления стимула [18, 29]. высокое разрешение по всей сетчатке, т.к. в этом случае в десятки раз возросла бы толщина зрительного нерва, зрительной радиации, поверхности первичной зрительной коры и размера головы. Энергоснабжение такого мозга превысило бы возможности организма. Существующий мозг человека, составляет всего около 2% веса тела, но потребляет 25% процентов кровоснабжения организма. Конструкция зрительной системы обеспечивает хорошее разрешение восприятия окружающего мира только за счет того, что может переводить взор, направляя фовеолиту в нужный участок поля зрения. Зрительная информация поступает в головной мозг по “каналам” зрительной системы, организованных аксонами различных типов ганглиозных клеток сетчатки, выделяющих различные свойства спроецированного на сетчатку оптикой глаза изображения. Это изображение динамично. Даже если весь окружающий мир застыл, глаз человека направляет взор то на один участок наблюдаемой сцены, то на другой. В случае фиксации взора на объекте, привлекшем внимание человека, глаз “дрожит”. Пространственные и временные свойства изображения, все время меняющего свое положение относительно структур сетчатки, различны. Непрерывные изменения изображения на сетчатке регистрируют рецепторы, которые перекодируют оптическую информацию об изображении в электрический сигнал и передают ее через ряд преобразований в нейронных сетях сетчатки дальше в мозг. Нейроны сетчатки и нейроны последующих уровней образуют отдельные каналы, перерабатывающие различную информацию об изображениях. Каналы зрительной системы имеют разные пространственные и временные характеристики. Они образованы ганглиозными клетками сетчатки различных типов [26]. Пространственные, цветовые и временные характеристики каналов были установлены различными методами. Соседние пики пространственно-частотных характеристик каналов соотносятся друг с другом по частоте как 1.4, что соответствует разнице в настройке в половину октавы. Ширина таких каналов около одной октавы [73, 61, 62]. Каналы, имеющие различия в пространственно-частотной и временной полосе пропускания, в особенностях описании цвета, принято рассматривать отдельно как системы, образованные мелкими и крупными клетками с разными анатомическими и функциональными свойствами. Это миджет и парасоль ганглиозные клетки сетчатки, соответственно связанные с ними и морфологически и функциоонально парво- и магноклеточные системы НКТ – наружного коленчатого тела. Модели многоканальной и пирамидальной организации зрительной системы близки и дополняют друг друга. УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК том 55 № 3 2024
ШЕЛЕПИН и др. Пирамидальная организация зрительной системы проявляется в том, что рецепторные входы каналов привязаны к определенным структурам сетчатки – фовеолите, фовеоле, фовеа, парафовеа, макуле и дальней периферии. На пути от центра сетчатки к периферии размер рецепторов увеличивается и растет расстояние между ними, между колбочками начинают появляться палочки, плотность которых постепенно увеличивается. Соответственно с эксцентриситетом снижается острота зрения. Для дальнейшего описания работы зрительного анализатора попытаемся сопоставить каналы с пирамидальной моделью организации нейронных сетей. МОДЕЛИ ПИРАМИДЫ. ОСНОВНЫЕ ПОЛОЖЕНИЯ Из всего многообразия моделей зрения именно эти модели востребованы в системах распознавания и наведения на цель в течение уже более 40 лет. Они оказались эффективными для выделения объектов из окружения и уменьшения избыточности при передаче информации об изображениях для решения инженерных задач, а в физиологии – для наглядного, геометрического описания этапов обработки изображений зрительной системой [1, 58, 59, 68—71]. Пирамидальные методы обработки изображений связаны с моделями многоканальной организации зрительной системы. Большинство создателей моделей пирамид подразумевают лишь последовательную иерархическую обработку изображений, осуществляемую послойно, но есть и модели рекурсивной обработки зрительной информации [1]. Пирамидальные модели перекликаются с фрактальным представлением об архитектуре нервной системы [85—87, 116—119, 122, 125, 134—136, 145, 150]. Принцип пирамидальной обработки рассмотрим на основе последовательной свертки изображения с неким ядром (например гауссианой). Разработчики моделей предполагают, что механизмы обработки изображений каждого слоя подобны, но размеры элементов разных слоев различны [68, 69, 70, 71]. Элементы последующих уровней могут иметь свой вход [71], а могут быть образованы элементами предыдущих уровней посредством их пространственного объединения с определенными весами [1, 59]. Первые модели [71] имитировали работу круглых рецептивных полей ганглиозных клеток сетчатки. Элементы в такой пирамиде имеют круглые рецептивные поля с весовыми функциями в виде разности двух гауссиан. Затем модели начали отражать функционирование зрительной системы на уровне простых полей стриарной коры [148]. В ней используются элементы с весовыми функциями, подобными элементам Габора, имеющими ориентационную настройку. Результаты работы нашей модели пирамиды, выполненные в ходе выполнения проекта “Рекогнитрон” (1988—1992 г.) по программе развития искусственного интеллекта Г.С. Поспелова, были описаны ранее [50—54]. Элементами матрицы каждого слоя пирамиды являются рецептивные поля одного размера. Размер элемента дискретизации изображения определяет разрешающую способность матрицы данного слоя пирамиды, которая постоянна в моделях в пределах матрицы одного уровня. Число элементов дискретизации в моделях постоянно от уровня к уровню. Размер элементов матрицы меняется от уровня к уровню, что обеспечивает инвариантность восприятия. Все матрицы центрированы относительно центра фовеолы. Матрицы с самым высоким разрешением занимают центральную часть поля зрения, тогда как матрицы с более грубым пространственным разрешением занимают как центр, так и периферию поля зрения. Отношение размеров элементов двух соседних матриц, как и пространственно-частотных каналов, равно 1.4. В центре поля зрения представлены матрицы всех размеров. При удалении к периферии поля зрения размер матрицы увеличивается, поэтому на периферии представлены рецептивные поля только большого размера. Общий размер матрицы лимитирует способность зрительной системы объединять отдельные дискреты в единое целое в зависимости от размера. Существуют определенные соотношения между общими размерами матриц, размерами ее элементов и размерами тестирующих зрительных объектов, являющихся оптимальными для матрицы данного уровня. В реальных условиях распознавания подбирается матрица, размеры элемента которой согласованы с размерами тестового объекта. Матрица фовеолиты, с наиболее мелкими ячейками (рецепторами и рецептивными полями нейронов последующих уровней), обеспечивает самое высокое разрешение. Наиболее крупная матрица занимает почти все поле зрения — около 180 угл. град. Но если пересчитывать на число гексагонов, то и та и другая матрицы в диаметре имеют около 20 гексагонов – элементов дискретизации. Самая простейшая пирамидальная модель предполагает, что выходы каждого элемента ее слоя при обработке изображений принимают лишь бинарные значения: происходит суммация сигнала в пределах элемента дискретизации. Но большинство моделей допускают более сложную организацию гексагонов в матрицах (слоях пирамиды): обработку изображений посредством интегрирования их функций контраста, умноженных на весовые функции гексагонов в виде либо разности двух гауссиан, либо элементов Габора. УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК том 55 № 3 2024
СТРУКТУРНОФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ ЗРИТЕЛЬНОЙ СИСТЕМЫ 7 Запуск саккады Остановка саккады Сетчатка глаза Слой фоторецепторов Каналы зрительной системы Рис. 2. Схематическое изображение механизма управления саккадами, основанное на многоканальной модели зрительной системы, имитирующей пирамидальную обработку изображений. в фовеолите, как было сказано ранее, определяется функцией рассеяния точки оптикой глаза, которая охватывает группу по крайней мере из 7 рецепторов – гексагон. Этот гексагон является базовым элементом дискретизации изображения. Гексагон содержит два типа колбочек, имеющих чувствительность преимущественно в длинноволновой ("красной") и в средневолновой ("зеленой") части видимого глазом спектра электромагнитных волн. Отсюда следует, что бинарный уровень квантования (отсчетов по яркости) в действительности может быть значительным. Разрешающая способность сетчатки глаза определяет дискретизацию изображения по пространству и помимо ширины на половине высоты функции рассеяния точки оптической системы глаза зависит еще и от расстояния между соседними активированными гексагонами. На основании измерения размеров элементов дискретизации (гексагонов) было показано сколько гексагонов надо, чтобы описать изображения различной сложности. Была определена шкала сложности воспринимаемых изображений и показано, что лицо человека является самым сложным целостным объектом для наблюдателя. Распознавание выражения лица человека и даже его мимики на пределе разрешения обеспечивает фовеолита – матрица около 20 гексагональных элементов в диаметре. Всего в фовеолите может быть до 300 таких гексагональных элементов [21]. При исследовании механизма целостности восприятия [2—10, 21, 27, 28, 39, 40, 45, 76—78, 80] в качестве стимулов были выбраны иероглифы [7], не носящие какого-то определенного смысла для испытуемых. Критерием являлась оценка четкости наблюдаемого изображения. Было показано [7], что четкое восприятие иероглифов возможно, если расстояние между элементами изображения не меньше 1 угл. мин. Для изображений, имеющих параллельные полосы, расстояния между полосами в среднем равны 3.7 угл. мин, что соответствует пространственной частоте 16 цикл/град, т.е. частоте самого высокочастотного канала, полученного Вилсоном и Гелбом [149] в психофизических экспериментах по различению пространственных частот методом маскировки. Все испытуемые (21 человек) одни иероглифы воспринимали как целостные фигуры, а другие делили на части [7]. Оказалось, что разделение изображений происходит при достижении ими некоторых определенных размеров, больших, чем необходимо для их четкого видения в 2—3 раза. Средний размер изображений, делящихся на 2 части, составлял 38.7 угл. мин, делящихся на 3 части — 68.3 угл. мин. Эти величины превосходят размеры фовеолиты в 2 и 3 раза соответственно. Ширина поля, разделяющего иероглифы на части, составила 2.5—3.2 угл. мин. [7], что согласуется с данными по восприятию точечных изображений На рис. 2 показано схематическое изображение слоев пирамидальной обработки изображений [50—54, 58—59, 68—71]. Каждый слой этой пирамидальной модели имеет свой независимый вход от матрицы фоторецепторов. Рисунок демонстрирует запуск движения глаз сигналом, возникающим в низкочастотном (НЧ) «перископическом» канале. Этот канал активирует систему управления движением глаз. В свою очередь, высокочастотный (ВЧ) "телескопический" канал выделяет те детали изображения, на которые его навел «перископический» канал. Перископическое зрение, а именно сигнал от низкочастотных каналов, запускает движение глаз [65—67]. Запуск происходит в результате активации нейронов с нелинейными характеристиками откликов рецептивных полей [104]. На рис. 2 слева дана схема неоднородной упаковки рецепторов сетчатки. Стрелки, направленные вправо, демонстрируют многоканальную организацию зрительной системы, двумерную организацию в виде слоев с разным размером гексагональных ячеек: низкочастотный канал или слой с большими элементами дискретизации, среднечастотный канал или слой пирамиды с ячейками среднего размера, высокочастотный канал или слой пирамиды с ячейками самого мелкого размера, представленный в сетчатке в фовеоле. Вверху стрелки показывают оппонентную систему управляющих сигналов: запуска и остановки движения глаз, перевода направления взора, наведения на цель области сетчатки с максимальным разрешением, называемой фовеолитой. Ф. Кемпбелл и Ю.Е. Шелепин показали, что фовеолита, которой соответствует самый мелкий слой пирамиды с максимальным физически возможным высоким разрешением, может быть использована для исследования основных возможностей обработки изображений: дискретизации и интеграции [21, 74, 75]. Дискретизация изображений УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК том 55 № 3 2024
ШЕЛЕПИН и др. [21, 74, 75]. Эти данные подтвердили предположение о возможной роли фовеолиты как слое пирамиды с самым высоким разрешением. Модель пирамидальной обработки изображений описывает входные звенья зрительной системы. Она учитывает плотность упаковки и размеры рецепторов на сетчатке, их изменение с эксцентриситетом. Становится понятным, как “матрица сетчатки” преобразуется в “матрицу нейронных сетей” последующих звеньев. Модель отражает пространственную упорядоченность и смысл в параллельных входах в организации последующих уровней зрительной системы. Одновременно проявляется и ретинотопическая упорядоченность, а именно соответствие определенных участков сетчатки определенным участкам НКТ (наружного коленчатого тела) и зрительной коры. Для функционирования такой системы должно существовать в каждом месте сетчатки большое число наборов ганглиозных клеток с рецептивными полями разного типа и размера. Например, число перекрытых рецептивных полей ганглиозных клеток сетчатки у кошки равно 35 [97]. Модели пирамид — модели иерархической организации зрительной системы — служат для обработки зрительных изображений. Эти модели учитывают структурную организацию и некоторые функциональные свойства зрительной системы. В их основе ретинотопическая организация. Согласование ретинотопического описания и топографического описания местности — это важное “инженерное” решение в эволюции [42, 60, 110]. МОДЕЛЬ МОДУЛЬНОЙ ОРГАНИЗАЦИИ ЗРИТЕЛЬНОЙ КОРЫ. ЕЕ СВЯЗЬ С МОДЕЛЬЮ ПИРАМИДЫ Следует отметить, что модели пирамид могут быть применимы к описанию всей зрительной системы в силу ретинотопической упорядоченности – соответствия определенных участков сетчатки участкам НКТ и некоторым областям зрительной коры. Известно, что ретинотопикой обладают области V1, V2, V3, MT, V4. Более сложные карты у нижневисочной, заднетеменной и лобной коры [123, 144]. Показано, что рецептивные поля каждого последующего уровня зрительной системы в среднем имеют больший размер и что размеры полей увеличиваются при удалении от центра поля зрения. Упорядоченность зрительной коры анатомы заметили давно [142]. Затем были открыты структурно-функциональные закономерности конструкции бинокулярной организации зрительной коры и упорядоченность в ориентационной настройке рецептивных полей к распознаванию минимальных фрагментов контуров изображений [105—109]. Однако функциональный смысл этой организации был раскрыт только в работах В.Д. Глезера [12—19, 98—101], и Ф.В. Кемпбелла [61, 62, 72, 73] и их соавторов, показавших, что описание наблюдаемой сцены в нейронных сетях зрительной коры может быть представлено посредством пространственно-частотного анализа как локальное двумерное описание ортогональными функциями Хаара, тригонометрическими функциями, элементами Габора и другими [13, 14 ]. Описание и понимание работы рецептивных полей нейронов зрительной коры дает модель модулей, предложенная В.Д. Глезером [98—101] на основании проведенных электрофизиологических исследований. В.Д. Глезер и соавт. [100] показали, что часть рецептивных полей нейронов стриарной коры кошки можно считать линейными. Их реакцию на любой сигнал можно представить как интеграл от весовой функции рецептивного поля, умноженную на функцию, задающую контраст стимула. Этими весовыми функциями могут служить как синусы и косинусы, так и элементы Габора, настроенные на различные частоты. Количество периодов в весовых функциях рецептивных полей ограничено, не превосходит четырех [101]. Модель модулей В. Д. Глезера [98—101] подобна модели пирамиды [68—71, 139] с дискретным и конечным набором пространственно-частотных фильтров. Рецептивные поля одного модуля, как и одного слоя пирамиды, имеют одинаковый размер. Согласно полученному распределению [101], отношения размеров модулей равны величине 1.41, что замечательным образом согласуется с ранее полученной в психофизических экспериментах Блэйкмором и Кэмпбеллом [61, 62] дискретностью пространственно-частотных каналов. Эти положения согласованы с моделью пирамиды: отдельный модуль можно рассматривать как слой пирамиды [111]. Заметим, что и в моделях пирамид могут использоваться в качестве весовых функций элементы Габора [81—83]. Отличие в моделях заключается в том, что в пирамиде, как правило, используется только один вид весовых функций, и рецептивные поля каждого слоя настроены на свою пространственную частоту. В одном модуле рецептивные поля настроены на кратные пространственные частоты и имеют разные оптимальные ориентации. Весовые функции в каждом модуле имеют число периодов от одного до четырех. Каждый модуль осуществляет разложение изображений в конечные обобщённые ряды Фурье. Такая операция с использованием в качестве весовых функций элементов Габора подобна в настоящее время широко используемому для анализа изображений вейвлет- преобразованию. На рис. 3 показаны примеры весовых функций двух различных модулей с весовыми функциями в виде элементов Габора. Нейро-, морфо- и физиологическая структура модуля — это суперколонка Хьюбела и Визела УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК том 55 № 3 2024
СТРУКТУРНОФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ ЗРИТЕЛЬНОЙ СИСТЕМЫ 9 30 20 10 Пространственная частота, цикл, угл. град 0 0 5 10 15 20 25 30 35 Эксцентриситет, угл. град Рецептивные поля (карты) Пространственно' частотные спектры рецептивных полей Рис. 3. Зависимость пиковой пространственной частоты от эксцентриситета. Примеры двумерных весовых функций рецептивных полей, определяющих эту зависимость [11, 49, 64, 146], показаны в середине, внизу приведены их ПЧ спектры. [105—109] и ее математическая модель [25]. Совокупность модулей разных размеров обеспечивает инвариантное описание формы изображений [111]. Разница между моделью модулей и моделью пирамид заключается в том, что в модели модулей каждый участок поля зрения обрабатывается модулями всех размеров, а в модели пирамид только центральный участок поля зрения обрабатывается слоями всех размеров. С этой точки зрения модель пирамиды более физиологична. На периферии обработка изображений в ней осуществляется слоями с рецептивными полями больших размеров, имеющими только низкочастотные фильтры. Для описания мелких деталей зрительная система производит перевод взора. Таким образом модель модулей может служить только для описания восприятия в центре поля зрения. В пользу представленных выше моделей могут служить следующие данные: весовые функции самого высокочастотного канала согласованы с оптической функцией рассеяния и расположением рецепторов на сетчатке [52]. Рецептивные поля с такими весовыми функциями обеспечивают остроту зрения наблюдателей, их взаимодействие объясняет краудинг-эффект (ухудшение восприятия вследствие окружающих изображение близлежащих контуров) на пределе разрешения зрительной системы [80]. Полученная Вилсоном и Гелбом [149] дискретность настройки рецептивных полей в психофизических экспериментах также подтверждает эти модели. Модель модулей позволила нам описать процесс сегментации изображений и механизм оценки их размера [4, 5]. Однако попытки промоделировать данные по опознанию изображений моделью модулей не увенчались успехом, т.к. при выборе модуля, охватывающего все изображение, модель модулей производит только его низкочастотную фильтрацию. Для опознания же в общем случае требуются и высокие частоты. Для объяснения механизмов опознания надо вводить взаимодействия между модулями разных размеров, то есть описывать нейронную сеть. Известно, что в зависимости от выполнения конкретной задачи проявляются разные латеральные связи между нейронами. Предпосылки для возникновения таких связей присутствуют в зрительной системе. В морфологических и нейрофизиологических исследованиях показано наличие и тормозных, и возбудительных связей в стриарной коре между нейронами разных модулей на достаточно больших расстояниях [89—96, 112, 113, 121, 147]. Решение вопроса об организации связей между нейронами приводит к возникновению в нейронной сети механизма, близкого по своей сути к согласованной фильтрации. Модель согласованной фильтрации чрезвычайно важна для понимания механизмов распознавания и для решения многих практических задач [22—24]. Модель была воплощена в действующие устройства на основе нескольких технических решений: на основе корреляционной схемы, на основе критерия отношения правдоподобия в рамках теории статистических решений. Этот критерий известен как решающее правило Байеса на основе модели “идеального наблюдателя”, который минимизирует общую вероятность ошибки [23, 24]. Теперь ее работоспособность обеспечивают сверточные и диффузионные нейронные сети. Предъявляемые на входе изображения претерпевают ряд последовательных преобразований. Выполняется первичная фильтрация, реализованная на основе пирамидальной модели. Затем происходит согласованная фильтрация, т.е. сравнение данного изображения с выученным “динамическим шаблоном”, хранящимся в памяти, затем наступает принятие решения – важнейший “конечный” этап обработки зрительной информации. Для принятия решений обычно надо иметь инвариантное к масштабным преобразованиям описание объекта — диапазон изменений размеров, в пределах которого восприятие человека к масштабным преобразованиям инвариантно. УСПЕХИ ФИЗИОЛОГИЧЕСКИХ НАУК том 55 № 3 2024