Двойственные изображения

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Утка или заяц?
Эту фигуру можно видеть как молодую женщину или как старую женщину, см. Моя жена и тёща

Двойственные изображения или обратимые фигуры — это оптическая иллюзия, которая использует графическую схожесть и свойства зрительной системы человека интерпретации двух и более различных форм изображения.

Имеются знаменитые рисунки, вызывающие феномен мультиустойчивого восприятия[англ.]. Мультиустойчивое восприятие — это возможность воспринимать одно изображение устойчиво в нескольких смыслах. Классическими примерами служат кролик-утка[1] и ваза Рубина[англ.][2]. Двойственные изображения важны в области психологии, поскольку часто являются инструментом исследования в экспериментах[3]. Существуют различные свидетельства о возможности представить двойственные изображения в уме[4], но большинство исследователей следуют теории, что такие изображения в уме правильно представить невозможно[5].

Распознавание и выделение двойственных изображений

[править | править код]

Средний уровень распознавания — это стадия обработки изображения, комбинирующая основные элементы сцены в отдельные распознаваемые группы объектов. Эта стадия предшествует высокому уровню распознавания (понимания сцены) и следует за предварительной обработкой (выделение элементов изображения). При распознавании изображений средний уровень распознавания используется для классификации объектов, которые мы видим. Высокий уровень распознавания используется, когда нужно классифицированные объекты распознать как специфичные члены группы. Например, на стадии среднеуровнего распознавания мы различаем лицо, а уже на стадии высокого уровня распознаём, что это лицо знакомого человека. Среднеуровневая стадия и высокоуровневая стадия распознавания являются ключевыми звеньями для понимания реального мира, который заполнен двойственными зрительными образами[6].

Восприятие изображения на среднем уровне распознавания

[править | править код]

Когда мы видим изображение, первое, что мы делаем — это попытка собрать все части сцены в различные группы[7]. Чтобы это сделать, нужно использовать базовые методы распознавания краёв. Края могут включать очевидные элементы восприятия, такие как края дома, и могут включать другие элементы, которые мозг должен обработать глубже, такие как края отдельных элементов лица. При поиске краёв зрительная система мозга распознаёт контрастные точки изображения. Способность распознавания краёв объекта содействует распознаванию объекта. В двойственных изображениях распознавание краёв остаётся естественным для восприятия изображения. Однако мозг подвергает изображение более детальному анализу для преодоления двойственности. Например, представим рисунок, в котором происходит изменение освещённости объекта и фона в противоположных направлениях (например, сверху вниз фон меняется с чёрного на белый, а цвет объекта меняется с белого на чёрный). Противоположность градиентов освещённости в конечном счёте приведёт к точке, где освещённости объекта и фона будут одинаковы. В этой точке нет видимого края изображения. Чтобы это учитывать, зрительная система соединяет изображение как целое, а не набор краёв, что позволяет видеть объект, а не набор краёв. Хотя нет полного образа увиденного, мозг способен дополнить этот образ, исходя из понимания физического мира и реального освещения[6].

«Kanizsa Triangle». Эти пространственно разделённые фрагменты создают впечатление иллюзорных контуров (известное как модальное завершение) треугольников

В двойственных изображениях иллюзия часто возникает из-за иллюзорных контуров[англ.]. Иллюзорный контур является воспринимаемым контуром без присутствия его в виде физического градиента. В примерах, где светлая фигура закрывает чёрные объекты на белом фоне, белая фигура кажется более яркой, чем фон, и края этой фигуры создают иллюзорный контур[8]. Эти иллюзорные контуры обрабатываются мозгом аналогично реальным контурам[7]. Зрительная система достигает этого путём умозаключения, исходя из полученной информации тем же путём, как она делает это, исходя из степени освещённости.

Правила группировки образа

[править | править код]

Во время среднеуровневого распознавания зрительная система использует набор эвристических методов, называемых правилами группировки образа[англ.], чтобы быстро распознать базовые объекты восприятия[3]. Это позволяет быстро и просто воспринимать образы путём рассмотрения эталонных образцов и знакомых образов вместо медленного процесса распознавания каждой части группы. Это помогает разрешить двойственность изображений, поскольку зрительная система принимает небольшие отклонения от образца и остаётся в силе осознать образец как целое. Правила группировки образа являются результатом опыта зрительной системы. Когда образец распознаётся часто, он сохраняется в памяти и может быть распознан снова без изучения объекта заново[6]. Например, когда мы смотрим на шахматную доску, мы распознаём эталонный образец шахматной доски, а не набор квадратов с поочерёдным изменением цвета.

Хорошее продолжение

[править | править код]

Принцип хорошего продолжения даёт зрительной системе базис распознавания продолжающихся краёв. Это означает, что в случае, когда распознаётся линия, имеется тенденция продолжить её в одном направлении. Это позволяет зрительной системе распознавать края сложных изображений путём определения, в какой точке линии пересекутся. Например, две прямые пересекающиеся прямые в букве «X» воспринимаются как две прямые, проходящие диагонально, в то время как две прямые в букве «V» воспринимаются как изменение направления линии. Примером двойственного изображения может быть две кривые, пересекающиеся в точке. Это соединение кривых может восприниматься как пересечение в букве «X», а не поворот кривых в точке соприкосновения. Иллюзия хорошего продолжения часто используется фокусниками для обмана зрителей[9].

Правило похожести утверждает, что изображения, похожие друг на друга, можно сгруппировать вместе как объекты одного типа, либо как части одного объекта. Поэтому, чем более похожи изображения или объекты, тем наиболее вероятно они будут сгруппированы вместе. Например, два квадрата среди множества окружностей будут сгруппированы вместе. Они могут различаться по цвету, размеру, ориентации или по другим признакам, но, в конечном счёте, будут сгруппированы[6].

Близость, общие области и связанность

[править | править код]
Закон близости

Свойством группировки объектов по признаку близости является пространственное расстояние между двумя объектами. Чем ближе объекты, тем более вероятно, что они принадлежат одной группе. Такое восприятие может оказаться двойственным без ощущения двойственности воспринимающим лицом.

Объекты, занимающие общую область в изображении, скорее всего, принадлежат одной группе. Эта общая область может занимать единственное пространственное место, и объекты могут занимать различные области вне группы. Объекты могут быть близкими, но восприниматься как принадлежащие разным группам под действием различных визуальных средств, таких как порог цвета, разделяющего два объекта.

Кроме того, объекты могут быть визуально соединены, например линиями, идущими из каждого объекта. Эти похожие, но иерархические правила предполагают, что некоторые правила группировки образов могут перекрывать другие правила[6].

Сегментация структуры и фон

[править | править код]

Зрительная система может помочь себе в разрешении двойственности путём распознавания текстуры изображения. Это осуществляется путём применения нескольких правил группировки. Текстура может дать информацию, помогающую различить целые объекты и смена текстуры в изображении показывает, какие различные объекты могут быть частью той же группы. Правила сегментации текстуры часто взаимодействуют и дополняют друг друга и изучение текстуры может дать информацию о слоях изображения, различить фон, передний план и объект[10].

Размер и окружение

[править | править код]

Если область текстуры полностью окружает другую область текстуры, скорее всего, это фон. Кроме того, малые области текстуры в изображении, скорее всего, принадлежат рисунку[6].

Параллельность и симметрия

[править | править код]

Параллельность является другим способом снятия неоднозначности фигуры в изображении. Ориентация контуров различных текстур в изображении может определять, какие объекты группируются. В общем случае параллельные контуры считаются членами того же объекта или группы объектов. Подобным же образом симметрия контуров может также определять фигуру на изображении[6].

Экстремальная граница и относительное движение

[править | править код]

Экстремальная граница — это изменения в текстуре, которые создают впечатление, что объект находится перед или за другим объектом. Это может быть следствием эффекта тени, который даёт видимость глубины. Некоторые эффекты экстремальной границы могут разрушить сегментацию. Воспринимаемая граница может также содействовать в различении объектов путём обследования вызванных движением изменений в текстуре относительно границы[6].

Использование двойственных изображений для сокрытия в реальном мире: камуфляж

[править | править код]

В природе организмы используют камуфляж для спасения от хищников. Это достигается путём создания двойственной сегментации структуры путём имитации окружающего пространства. Без способности получить заметную разницу в текстуре и позиции хищник не в состоянии видеть свою жертву[6].

Многие двойственные изображения получаются путём некоторой окклюзии, в которой текстура объекта неожиданно прекращается. Окклюзия — это зрительное восприятие объекта, который находится перед другим объектом или позади него, что даёт информацию о порядке уровней текстуры[6]. Иллюзия окклюзии наблюдается в эффекте иллюзорных контуров, когда окклюзия воспринимается, даже когда она не существует. Здесь двойственное изображение воспринимается как реализация окклюзии. Когда объект закрывается (другим объектом), зрительная система имеет информацию только о видимых частях объекта, так что остальная обработка должна быть глубже и должна опираться на память.

Случайная точка зрения

[править | править код]

Случайная точка зрения — это отдельная позиция, в которой воспроизводится двойственность изображения. Случайная точка зрения не даёт достаточно информации, что за объект представлен на изображении[11]. Часто такое изображение воспринимается неверно и даёт иллюзию, отличающуюся от реальности. Например, изображение может быть разбито пополам, и верхняя половина увеличена и расположена дальше от наблюдателя в пространстве. Изображение при этом воспринимается как единое целое только с одной точки, хотя в действительности оно представляет две совершенно разные половинки объекта. Уличные художники часто используют трюк с точкой просмотра для создания плоских сцен на земле, которые выглядят как трёхмерные.

Распознавание объекта на высокоуровневом этапе

[править | править код]
Лестница Шрёдера[англ.]

Следующим этапом после простого восприятия объекта является распознавание объекта. Распознавание объекта играет решающую роль в разрешении двойственных изображений и опирается существенным образом на память и предварительные знания. Чтобы распознать объект, зрительная система находит знакомые компоненты и сравнивает воспринимаемый объект с представлением объекта в памяти[7]. Это можно сделать, используя различные шаблоны объекта, такие как «собака» для представления собак вообще. Метод шаблонов не всегда успешен, поскольку члены группы могут существенно визуально отличаться друг от друга и могут выглядеть существенно различными, если смотреть под разными углами. Чтобы учитывать проблему угла зрения, зрительная система определяет знакомые компоненты объекта в 3-мерном пространстве. Если компоненты воспринимаемого объекта находятся в той же позиции и ориентации, что и объект в памяти, распознавание возможно[6]. Исследования показали, что люди, более креативные в своём воображении, лучше воспринимают двойственные изображения. Это может быть следствием способности быстрого распознавания шаблонов в изображении[12]. Когда представляется в памяти ментальный образ двойственного изображения таким же образом, что и нормальное изображение, определяется каждая часть и затем вставляется в ментальный образ. Чем сложнее сцена, тем дольше идёт процесс определения части и добавления в изображение[13].

Куб Некера — проволочный каркас куба без намёка на глубину.

Фигуры, нарисованные без намёка на глубину, могут стать неоднозначными. Классическим примером этого феномена служат куб Неккера[6] и ромбическая мозаика (видимая как изометрический рисунок кубов).

Использование памяти и недавнего опыта

[править | править код]

Наша память имеет большое воздействие на распознавание двойственного изображения, так как это помогает зрительной системе идентифицировать и распознать объекты без необходимости анализировать и категоризировать их повторно. Без участия памяти и предварительного знания изображение с несколькими группами похожих предметов будет трудно воспринимать. Любой объект может иметь двойственное представление и может быть ошибочно отнесён к неверной группе. Таким образом, для правильного восприятия необходим предварительный опыт[14]. Были проведены исследования с помощью психологического теста «Greebles»[англ.], чтобы показать роль памяти в распознавании объектов[6]. Предварительная подготовка испытуемых путём показа похожих объектов имела большой эффект на ускорение разрешения неоднозначности[14].

Нарушения восприятия

[править | править код]

Прозопагнозия — это болезнь, которая приводит к невозможности распознавать лица. Зрительная система проходит средний уровень распознавания и выделяет лицо как объект, но высокоуровневое распознавание отказывает идентифицировать, кому это лицо принадлежит. В этом случае зрительная система распознаёт двойственный объект (лицо), но не в состоянии разрешить двойственность с помощью памяти[6].

Примечания

[править | править код]
  1. Рисунок уткозайца, по-видимому, является одним из старейших рисунков такого типа; он был опубликован в немецком юмористическом журнале Fliegende Blätter (23 октября 1892, стр. 147).
  2. Parkkonen, Andersson, Hämäläinen, Hari, 2008, с. 20500–20504.
  3. 1 2 Wimmer, Doherty, 2011, с. 87–104.
  4. Mast, Kosslyn, 2002, с. 57–70.
  5. Chambers, Reisberg, 1985, с. 317–328.
  6. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Wolfe, Kluender, Levi, 2009.
  7. 1 2 3 Halko, 2008.
  8. Bradley, Dumais, 1975, с. 582–584.
  9. Bamhart, 2010, с. 1286–1289.
  10. Tang, X. A model for figure-ground segmentation by self-organized cue integration. Dissertation Abstracts International: Section B: The Sciences and Engineering, 3245. Retrieved from http://search.proquest.com/docview/621577763 Архивная копия от 30 сентября 2018 на Wayback Machine
  11. Koning, van Lier, 2006, с. 52–58.
  12. Riquelme, 2002, с. 105–116.
  13. Kosslyn, Reiser, Farah, Fliegel, 1983, с. 278–303.
  14. 1 2 Daelli, van Rijsbergen, Treves, 2010, с. 81–91.

Литература

[править | править код]
  • Wolfe J., Kluender K., Levi D. Sensation and perception. — 2 ed.. — 2009.
  • Parkkonen L., Andersson J., Hämäläinen M., Hari R. Early visual brain areas reflect the percept of an ambiguous scene // Proceedings of the National Academy of Sciences of the United States of America. — 2008. — Vol. 105. — Вып. 51. — doi:10.1073/pnas.0810966105. — PMID 19074267. — PMC 2602606.
  • Wimmer M., Doherty M. The development of ambiguous figure perception: Vi. conception and perception of ambiguous figures // Monographs of the Society for Research in Child Development. — 2011. — Т. 76, вып. 1. — doi:10.1111/j.1540-5834.2011.00595.x.
  • Mast F.W., Kosslyn S.M. Visual mental images can be ambiguous: Insights from individual differences in spatial transformation abilities // Cognition. — 2002. — Т. 86, вып. 1. — doi:10.1016/S0010-0277(02)00137-3.
  • Chambers D., Reisberg D. Can mental images be ambiguous? // Journal of Experimental Psychology: Human Perception and Performance. — 1985. — Т. 11, вып. 3. — doi:10.1037/0096-1523.11.3.317.
  • Bradley D.R., Dumais S.T. Ambiguous cognitive contours // Nature. — 1975. — Т. 257, вып. 5527. — doi:10.1038/257582a0.
  • Bamhart A.S. The exploitation of gestalt principles by magicians // Perception. — 2010. — Т. 39, вып. 9. — doi:10.1068/p6766.
  • Koning A., van Lier R. No symmetry advantage when object matching involves accidental viewpoints // Psychological Research/Psychologische Forschung. — 2006. — Т. 70, вып. 1. — doi:10.1007/s00426-004-0191-8.
  • Riquelme H. Can people creative in imagery interpret ambiguous figures faster than people less creative in imagery? // The Journal of Creative Behavior. — 2002. — Т. 36, вып. 2. — doi:10.1002/j.2162-6057.2002.tb01059.x.
  • Kosslyn S.M., Reiser B.J., Farah M.J., Fliegel S.L. Generating visual images: Units and relations // Journal of Experimental Psychology: General. — 1983. — Т. 112, вып. 2. — doi:10.1037/0096-3445.112.2.278.
  • Daelli V., van Rijsbergen N.J., Treves A. How recent experience affects the perception of ambiguous objects // Brain Research. — 2010. — Т. 1322. — doi:10.1016/j.brainres.2010.01.060. — PMID 20122901.
  • Halko M.A. Illusory contour and surface completion mechanisms in human visual cortex. // Dissertation Abstracts International: Section B: The Sciences and Engineering, 3303. — 2008.