Изображение как двумерный массив данных. Двухмерная графика

04.02.2019
]

Первые вычислительные машины 40-х годов XX-века ("ABC" (1942), "ENIAC"(1946), "EDSAC" (1949), "МЭСМ" (1950)), разрабатывались и использовались строго для расчетов и не имели отдельных средств для работы с графикой. Однако уже тогда некоторые энтузиасты пытались использовались эти ЭВМ первого поколения на электронных лампах для получения и обработки изображений. Программируя память первых моделей ЭВМ и устройств вывода информации, построенных на основе матрицы электрических ламп, можно было получать простые узоры. Лампы накаливания включались и отключались в определенном порядке, образуя изображения различных фигур.

В конце 40-х и начале 50-х годах , в многих компьютерах стали использовать электронно-лучевые трубки (ЭЛТ) в виде осциллографов, или трубок Вильямса , которые использовались как оперативная память. Теоретически, записывая 0 или 1 в определенном порядке в такую память, на экране можно было отобразить какое-нибудь изображение, но на практике это не использовалось. Однако в 1952 году британский инженер Александр Дуглас (Alexander Shafto "Sandy" Douglas ) написал шуточную программу "OXO " (Крестики-нолики) для программируемого компьютера EDSAC (1949г.), ставшей в истории первой компьютерной игрой. Изображение решетки и нолики с крестиками строилось путем программирования трубки Вильямса или прорисовывалось на соседнем ЭЛТ.

В 50-х годах вычислительные возможности компьютеров и графические возможности периферийных средств не позволяли рисовать высоко детализированные изображения, но давали возможно осуществить посимвольный вывод изображений на экраны мониторов и типовых принтеров. Изображения на этих устройствах строились из алфавитно-цифровых символов (символьная графика , позже пришло название ASCII-графика и ASCII-Art ). Всё просто: разница в плотности алфавитно-цифровых знаков и особенности человеческого зрения: не воспринимать детали изображения c большого расстояния, позволила создавать на компьютере рисунки и псевдографические объекты. Подобные изображения до появления компьютеров на бумаге создавали машинистки на печатных машинках в конце 19 века.

В 1950 году энтузиаст Бенджамин Лапоски (Ben Laposky ), математик, художник и чертежник, начал экспериментировать с экраном осциллографа, создавая сложные динамичные фигуры - осцилионы . Танец света создавался сложнейшими настройками на этом электронно-лучевом приборе. Для запечатления изображений применялись высокоскоростная фотография и особые объективы, позже были добавлены пигментированные фильтры, наполнявшие снимки цветом.

В 1950 году в военном компьютере Whirlwind-I (по русс. Вихрь, Ураган), встроенный в систему SAGE противовоздушной обороны США, впервые был применён монитор - как средство отображения визуальной и графической информации. [ ]

В 1955 году в лаборатории Массачусетского технологического института (MIT) было изобретено световое перо (Light pen) . Световое перо является светочувствительным устройством ввода компьютера, в основном наутилусом, который используется для выбора текста, рисования изображений и взаимодействия с элементами пользовательского интерфейса на экране компьютера или монитора. Перо хорошо работает только с ЭЛТ(CRT)-мониторами из-за того, как такие мониторы сканируют экран, который является одним пикселем за раз, что дает компьютеру способ отслеживать ожидаемое время сканирования электронным лучом и определять положение пера на основе последней метки времени сканирования. На кончике пера находится фотоэлемент, испускающий электронный импульсы и одновременно реагирующий на пиковое свечение, соответствующее моменту прохода электронного луча. Достаточно синхронизировать импульс с положением электронной пушки, чтобы определить, куда именно указывает перо.

Световые перья вовсю использовались в вычислительных терминалах образца 1960-х годов. С появлением ЖК (LCD)-мониторов в 90-х практически перестали использоваться, так как с экранами этих устройств работа светового пера стала невозможной.

В 1957 году инженер Рассел Кирш (Russell A. Kirsch ) из Национального бюро стандартов США изобрел для компьютера SEAC первый сканер и получил на нём первое цифровое изображение - скан-фото маленького ребенка, собственного сына Уолдена (анг. Walden). [ ]

В 60-е годы XX-века начался реальный расцвет компьютерной графики . С приходом новых высокопроизводительных по тем меркам компьютеров с мониторами на основе транзисторов (2-е поколение ЭВМ) и позже микросхем (3-е поколение ЭВМ) машинная графика стала не только сферой энтузиастов, но серьезным научно-практическим направлением развития компьютерных технологий. Появились первые суперкомпьютеры (СВС 6600 и Cray-1 ) позволившие работать не только с быстрыми вычислениями, но с компьютерной графикой на новом уровне.

В 1960 году инженер-дизайнер Ульям Феттер (William Fetter ) из авиастроительной корпорации Боинг (англ. Boeing) впервые ввел термин "Компьютерная графика" . Феттер, рисуя дизайн кабины пилотов самолета на рабочем компьютере, решил в технической документации описать род своей деятельности. В 1964 году Ульям Феттер также создал на компьютере проволочную графическую модель человека и назвал ее "Человек Боинга", он же "Первый человек", которую позже использовали в телерекламе 60-х годов.

В 1962 году программист Стив Рассел (Steve Russell ) из МТИ на компьютере DEC PDP-1 создал отдельную программу с графикой - компьютерную игру «Spacewar! ». Создание игры заняло около 200 человеко-часов . Игра была использовала джойстик и обладала интересной физикой с симпатичной графикой. Однако первой компьютерной игрой но без графики можно считать программу Александра Дугласа "OXO" (Крестики-нолики, 1952)

В 1963 году на основе компьютера "TX-2 " американский инженер-программист из МТИ, пионер компьютерной графики, Айвен Сазерленд (Ivan Edward Sutherland ) создал программно-аппаратный комплекс Sketchpad , который позволял рисовать точки, линии и окружности на трубке световым пером . Поддерживались базовые действия с примитивами: перемещение, копирование и др. По сути, это был первый векторный редактор , реализованный на компьютере, ставшим прообразом современных САПР (систем автоматизированного проектирования), например современных AutoCAD или Компас-3D. Также программу можно назвать первым графическим интерфейсом, вышедшем за 10 лет до компьютера Xerox Alto (1973г.), причём она являлась таковой ещё до появления самого термина. Айвен Сазерленд в 1968 году создал прообраз первого компьютерного шлема виртуальной реальности, назвав его "Дамокловым мечом" по аналогии с древнегреческой легендой.

В середине 1960-х гг. появились разработки в промышленных приложениях компьютерной графики. Так, под руководством Т. Мофетта и Н. Тейлора фирма Itek разработала цифровую электронную чертёжную машину (графопостроитель ).

В 1963 году программист из Bell Labs Эдвард Зейджек (Edward E. Zajac ) сделал первую компьютерную анимацию - движение спутника вокруг Земли . Анимация демонстрировала теоретический спутник, который использовал гироскопы, чтобы поддерживать свою ориентацию относительно Земли. Вся компьютерная обработка была сделана на компьютерах серий IBM 7090 или 7094 с использование программы ORBIT. [ ]

В последующие годы выходят и другие, но более сложные и значимые анимации: "Tesseract" (Тессеракт он же гиперкуб, 1965г.) Майкла Нолла из «Bell Labs», "Hummengbird" (Колибри, 1967г.) Чарльза Цури и Джеймса Шаферса, "Кошечка" (1968г.) Николая Константинова, "Metadata" (Метаданные, 1971г.) Питера Фолдерса и т..д.

В 1964 году выпущен IBM 2250 , первый коммерческий графический терминал для мейнфрейма IBM/360.

В 1964 году компания General Motors совместно с IBM представила систему автоматизированного проектирования DAC-1.

В 1967 году профессор Дуглас Энгельбарт (Douglas Carl Engelbart ) сконструировал первую компьютерную мышь (указатель XY-координат) и показал ее возможности на выставке в городе Сан-Франциско в 1968 году.

В 1967 году сотрудник IBM Артур Аппель описывает алгоритм удаления невидимых ребер (в том числе и частично скрытых), позднее названный лучевым кастингом , отправной точкой современной 3D-графики и фотореализма.

В том же 1968 году [ ] существенный прогресс компьютерная графика испытала с появлением возможности запоминать изображения и выводить их на компьютерном дисплее , электронно-лучевой трубке . Появились первые растровые мониторы.

В 70-х годах компьютерная графика получила новый рывок в развитии. Появились первые цветные мониторы и цветная графика. Суперкомпьютеры с цветными дисплеями стали использоваться для создания спецэффектов в кино (фантастическая эпопея 1977 года "Звездные войны " режиссера Джорджа Лукаса, фантастический ужастик "Чужой" (анг. "Alien") киностудии XX-век Fox и режиссера Ридли Скотта , и позже недооцененный научно-фантастический фильм 1982 года «Трон» (англ. Tron) студии Walt Disney и режиссёра Стивена Лисбергера ). В этот период компьютеры стали еще более быстродействующими, их научили рисовать 3D-изображения, возникла трехмерная графика и новое направление визуализации - фрактальная графика. Появились персональные компьютеры с графическими интерфейсами, использующие компьютерную мышь (Xerox Alto (1973г.)).

В 1971 году математик Анри Гуро, в 1972 году Джим Блинн и в 1973 году Буй Туонг Фонг разработали модели затенения , позволившая графике выйти за рамки плоскости и точно отобразить глубину сцены. Джим Блинн стал новатором в области внедрения карт рельефа, техники моделирования неровных поверхностей. А Алгорим Фонга впоследствии стал основным в современных компьютерных играх.

В 1972 году пионер компьютерной графики Эдвин Катмулл (Edwin Catmull ) создал первое 3D-изображение - проволочную и текстурированную модель собственной левой руки.

В 1975 году французский математик Бенуа Мандельброт (Benoît B. Mandelbrot ), программируя компьютер модели IBM, построил на нем изображение результатов вычисления комплексной математической формулы (множество Мандельброта), и в результате анализа полученных повторявших закономерностей дал красивым изображениям название - фрактал (с лат. дробный, разбитый). Так возникла фрактальная геометрия и новое перспективное направление в компьютерной графике - фрактальная графика .

В конце 70-х годах , с появлением персональных компьютеров (4-го поколения - на микропроцессорах), графика с промышленных систем перешла на конкретные рабочие места и в дома простых пользователей. Зародилась индустрия видеоигр и компьютерных игр. Первым массовым персональным компьютером с цветной графикой стал ПК Apple II (1977г.), позже Apple Macintosh (1984г.)

В 80-х годах , с развитием видеосистемы персональных компьютеров IBM PC (1981г. ) графика становилась более детализированной и цветопередающей (повысилось разрешение изображений и расширилась цветовая палитра). Появились первые видеостандарты MDA, CGA, EGA,VGA, SVGA. Разработаны первые стандарты файловых графических форматов, например GIF (1987), Возникло графическое моделирование...

Текущее состояние [ | ] Основные области применения [ | ]

Научная графика - первые компьютеры использовались лишь для решения научных и производственных задач. Чтобы лучше понять полученные результаты, производили их графическую обработку, строили графики, диаграммы, чертежи рассчитанных конструкций. Первые графики на машине получали в режиме символьной печати. Затем появились специальные устройства - графопостроители (плоттеры) для вычерчивания чертежей и графиков чернильным пером на бумаге. Современная научная компьютерная графика дает возможность проводить вычислительные эксперименты с наглядным представлением их результатов.

Деловая графика - область компьютерной графики, предназначенная для наглядного представления различных показателей работы учреждений. Плановые показатели, отчётная документация, статистические сводки - вот объекты, для которых с помощью деловой графики создаются иллюстративные материалы. Программные средства деловой графики включаются в состав электронных таблиц.

Конструкторская графика используется в работе инженеров-конструкторов, архитекторов, изобретателей новой техники. Этот вид компьютерной графики является обязательным элементом САПР (систем автоматизации проектирования). Средствами конструкторской графики можно получать как плоские изображения (проекции, сечения), так и пространственные трёхмерные изображения.

Иллюстративная графика - это произвольное рисование и черчение на экране монитора. Пакеты иллюстративной графики относятся к прикладному программному обеспечению общего назначения. Простейшие программные средства иллюстративной графики называются графическими редакторами.

Художественная и рекламная графика - ставшая популярной во многом благодаря телевидению. С помощью компьютера создаются рекламные ролики, мультфильмы, компьютерные игры, видеоуроки, видеопрезентации. Графические пакеты для этих целей требуют больших ресурсов компьютера по быстродействию и памяти. Отличительной особенностью этих графических пакетов является возможность создания реалистических изображений и «движущихся картинок». Получение рисунков трёхмерных объектов, их повороты, приближения, удаления, деформации связано с большим объёмом вычислений. Передача освещённости объекта в зависимости от положения источника света, от расположения теней, от фактуры поверхности, требует расчётов, учитывающих законы оптики.

Пиксель арт Пиксельная графика, большая форма цифрового искусства, создается с помощью программного обеспечения для растровой графики, где изображения редактируются на уровне пикселей. В увеличенной части изображения отдельные пиксели отображаются в виде квадратов и их легко увидеть. В цифровых изображениях пиксель (или элемент изображения) - это отдельная точка в растровом изображении. Пиксели размещаются на регулярной двумерной сетке и часто представлены точками или квадратами. Графика в большинстве старых (или относительно ограниченных) компьютерных и видеоигр, графические калькуляторные игры и многие игры для мобильных телефонов - в основном пиксельная графика.

Компьютерная анимация - это получение движущихся изображений на экране дисплея. Художник создает на экране рисунки начального и конечного положения движущихся объектов, все промежуточные состояния рассчитывает и изображает компьютер, выполняя расчёты, опирающиеся на математическое описание данного вида движения. Такая анимация называется мультипликация по ключевым кадрам . Так же существуют другие различные виды компьютерной анимации: процедурная анимация , шейповая анимация , программируемая анимация и анимация, где художник сам отрисовывает все кадры "вручную". Полученные рисунки, выводимые последовательно на экран с определённой частотой, создают иллюзию движения.

Мультимедиа - это объединение высококачественного изображения на экране компьютера со звуковым сопровождением. Наибольшее распространение системы мультимедиа получили в области обучения, рекламы, развлечений.

Научная работа [ | ]

Компьютерная графика является также одной из областей научной деятельности. В области компьютерной графики защищаются диссертации, а также проводятся различные конференции:

  • конференция Siggraph , проводится в США
  • конференции Eurographics , проводятся ассоциацией Eurographics ежегодно в странах Европы
  • конференция Графикон , проводится в России
  • CG-событие , проводится в России
  • CG Wave 2008 , CG Wave, проводится в России
Техническая сторона [ | ]

По способам задания изображений графику можно разделить на категории:

Двухмерная графика [ | ]

Двухмерная (2D - от англ. two dimensions - «два измерения») компьютерная графика классифицируется по типу представления графической информации, и следующими из него алгоритмами обработки изображений. Обычно компьютерную графику разделяют на векторную и растровую, хотя обособляют ещё и фрактальный тип представления изображений.

Векторная графика [ | ]

Вместе с тем, не всякое изображение можно представить как набор из примитивов. Такой способ представления хорош для схем, используется для масштабируемых шрифтов, деловой графики, очень широко используется для создания мультфильмов и просто роликов разного содержания.

Растровая графика [ | ]

Пример растрового рисунка

Фрактальная графика [ | ]

Фрактальное дерево

CGI графика [ | ]

CGI (англ. computer-generated imagery , букв. «изображения, созданные компьютером») - изображения, получаемые компьютером на основе расчета и использующиеся в изобразительном искусстве , печати , кинематографических спецэффектах , на телевидении и в симуляторах . Созданием движущихся изображений занимается компьютерная анимация , представляющая собой более узкую область графики CGI.

Представление цветов в компьютере [ | ]

Для передачи и хранения цвета в компьютерной графике используются различные формы его представления. В общем случае цвет представляет собой набор чисел, координат в некоторой цветовой системе.

Стандартные способы хранения и обработки цвета в компьютере обусловлены свойствами человеческого зрения. Наиболее распространены системы RGB для дисплеев и CMYK для работы в типографском деле.

Иногда используется система с большим, чем три, числом компонент. ируется спектр отражения или испускания источника, что позволяет более точно описать физические свойства цвета. Такие схемы используются в фотореалистичном трёхмерном рендеринге.

Реальная сторона графики [ | ]

Любое изображение на мониторе, в силу его плоскости, становится растровым, так как монитор это матрица, он состоит из столбцов и строк. Трёхмерная графика существует лишь в нашем воображении, так как то, что мы видим на мониторе - это проекция трёхмерной фигуры, а уже создаём пространство мы сами. Таким образом, визуализация графики бывает только растровая и векторная, а способ визуализации это только растр(набор пикселей), а от количества этих пикселей зависит способ задания изображения.

Мир трехмерен. Его изображение двухмерно. Важной задачей живописи и, теперь, фотографии является передача трехмерности пространства. Некоторыми приемами владели уже римляне, потом они были забыты и начали возвращаться в классическую живопись с Ренессансом.

Основной прием создания трехмерного пространства в живописи - перспектива. Железнодорожные рельсы, удаляясь от зрителя, визуально сужаются. В живописи рельсы можно физически сузить. В фотографии перспектива возникает автоматически: камера снимет рельсы такими же зауженными, как их видит глаз. Однако не допускайте почти смыкания: оно будет выглядеть уже не перспективой, а странной фигурой; между рельсами, сторонами улицы, берегами реки должен сохраняться заметный просвет.

Важно понимать, что линейная перспектива - наиболее примитивный, реалистичный способ передачи мира. Не случайно ее появление связано с театральными декорациями (Флоренский, “Обратная перспектива”). Условность, простота передачи театральной сцены небольшой глубины очень подходит для фотографии, лишенной разнообразия приемов, доступных в живописи.

Существуют перспективы, значительно более интересные, чем линейная. В работах китайских мастеров присутствует плавающая перспектива, когда объекты изображены одновременно снизу, сверху и спереди. Она не была технической ошибкой некомпетентных художников: легендарный автор этой техники, Guo Xi писал, что такое отображение позволяет осознать мир в его тотальности. Аналогична техника русской иконописи, в которой зритель может видеть лицо и спину персонажа одновременно. Интересным приемом иконописи, встречающимся также у западноевропейских художников, была обратная перспектива, в которой удаленные объекты, наоборот, крупнее близких, подчеркивая важность. Только в наши дни было установлено, что такая перспектива правильная: в отличие от удаленных предметов, ближний план действительно воспринимается в обратной перспективе (Раушенбах). Средствами фотошопа можно добиться обратной перспективы, увеличивая объекты заднего плана. Для привыкшего к законам фотографии зрителя смотреться такое изображение будет странно.

Введение в кадр угла здания, от которого в обе стороны расходятся стены, создает подобие изометрической перспективы. Мозг понимает, что стены находятся под прямым углом, и раскладывает остальное изображение соответственно. Такая перспектива динамичнее фронтальной и естественнее для ближнего плана. Просто вводите в кадр торцевые углы предметов и близко расположенных зданий.

За счет расширения, изометрическая перспектива мажорна, что редко подходит для классического портрета. Линейная перспектива, за счет сужения, лучше передает минорные эмоции.

На этапе съемки, фотографу доступен ряд инструментов, подчеркивающих перспективу. Уходящие вдаль объекты равной ширины (колея, улица, колонны, борозды) своим сужением и даже просто удалением обозначают зрителю трехмерность пространства. Эффект сильнее, если снимать с низкого ракурса, чтобы увеличить искажения перспективы. Для пейзажной съемки этого достаточно, но при небольшой глубине изображения интерьерной съемки эффект малозаметен. Его можно немного усилить в пост-обработке, заузив верхнюю часть изображения (Transform Perspective). Впрочем, и в пейзаже гипертрофированная перспектива может выглядеть интересно.

Глубина может быть явной по смыслу изображения: здания разделены улицей или рекой. Диагональ подчеркивает трехмерность; например, мост через реку.

Предметы известного зрителю размера на заднем плане задают масштаб и, соответственно, формируют перспективу. В пейзажной съемке таким предметом может быть автомобиль, а в портретной попробуйте присогнуть и поджать под стул ногу (от камеры), чтобы она, оставаясь видимой, казалась меньше. Можно даже чуть уменьшить эту ногу в пост-обработке.

Орнамент передает перспективу за счет визуального уменьшения элементов. Примером будет крупная плитка на полу, линии разметки на дороге.

Существует техника гипертрофированного переднего плана. Диспропорционально большой, он создает глубину изображения. Сравнивая масштаб переднего плана и модели, глаз приходит к выводу, что модель гораздо дальше, чем кажется. Гипертрофированность должна оставаться едва различимой, чтобы изображение не воспринималось ошибкой. Этот прием подходит не только для пост-обработки, но и при съемке: исказите пропорции, снимая объективом 35 или 50мм. Съемка широкоугольным объективом растягивает пространство, усиливая его трехмерность за счет нарушения пропорций. Эффект сильнее, если снимать модель с близкого расстояния, но опасайтесь гротескных пропорций: только авторы религиозных изображений могут изображать человека больше здания.

Отлично работает пересечение. Если яблоко частично закрывает собой грушу, то мозг не ошибется: яблоко находится впереди груши. Модель, частично закрывающая собой мебель, создает тем самым глубину интерьера.

Глубину изображению придает также чередование светлых и темных пятен. Мозг знает по опыту, что находящиеся рядом предметы освещены примерно одинаково, поэтому интерпретирует по-разному освещенные предметы как расположенные на разном расстоянии. Для такого эффекта, пятна чередуются в направлении оси перспективы - вглубь изображения, а не поперек него. Например, снимая модель, лежащую от камеры в темном кадре, положите блики света возле ягодиц и возле ног. Можно осветлять/ затемнять области в пост-обработке.

Последовательность все более темных предметов воспринимается уменьшающейся. За счет постепенного затенения объектов, расположенных по активной линии, можно получить тонкое ощущение перспективы. Аналогично, глубина передается ослаблением света: пустите полосу света по мебели или на полу.

Трехмерное изображение можно получить за счет не только светового, но и цветового контраста. Этот прием был известен фламандским живописцам, которые располагали на своих натюрмортах яркие цветные пятна. Красный гранат и желтый лимон рядом будут смотреться трехмерно даже при плоском фронтальном освещении. Особенно хорошо они будут выступать вперед на фоне фиолетового винограда: теплый цвет на фоне холодного. Яркие цветные поверхности хорошо вырываются из темноты даже слабым светом, типичным для натюрморта. Контраст цветов лучше работает с основными цветами: красным, желтым, синим, а не оттенками.

На черном фоне, желтый цвет выступает вперед, синий прячется назад. На белом фоне - наоборот. Насыщенность цвета усиливает этот эффект. Почему так происходит? Желтый цвет не бывает темным, поэтому мозг отказывается верить в то, что желтый предмет может быть погружен в темный фон, не освещен. Синий цвет, наоборот, темный.

Усиление перспективы в пост-обработке сводится к имитации атмосферного восприятия: удаленные объекты кажутся нам более светлыми, размытыми, со сниженным контрастом по яркости, насыщенности и тону.

Помимо больших расстояний, атмосферные эффекты естественно выглядят в утренней дымке, тумане, накуренном баре. Учитывайте погоду: в облачный день или в сумерках не может быть значительного отличия между передним и задним планами.

Самый сильный из факторов - контраст по яркости. В настройках это обычный контраст. Снизьте контрастность удаленных предметов, поднимите контрастность переднего плана - и изображение станет выпуклым. Речь не о контрасте между передним и задним планами, а о контрастности заднего плана, которая должна быть ниже контрастности переднего. Этот метод подходит не только для пейзажей и жанровой съемки, но и студийного портрета: поднимите контраст передней части лица, снизьте контраст на волосах и скулах, одежде. Портретные фильтры делают нечто похожее, размывая кожу модели и оставляя резкими глаза и губы.

Корректировка контраста - самый простой способ трехмерной пост-обработки изображения. В отличие от других процессов, зритель практически не заметит изменений, что позволит сохранить максимальную естественность.

На снижение контраста похоже размытие, но это разные процессы. Изображение может быть низкоконтрастным, оставаясь резким. В силу ограниченной глубины резкости, размытие удаленных предметов остается наиболее популярным способом передачи трехмерности на фотографии, и его легко усилить, размыв дальний план в пост-обработке. Поэтому же на заднем плане следует располагать поменьше деталей - мозг не ожидает различимых предметов вдалеке. Между тем, снижение контраста лучше отвечает естественному восприятию: удаленные горы видны низкоконтрастными, а не размытыми, потому что сканируя пейзаж, взгляд постоянно перефокусируется, ему чужда проблема глубины резкости. Размывая задний план, можно заодно поднять резкость переднего. Дополнительно, на переднем плане можно усилить линии изображения (High Pass Filter или Clarity). Именно высокая резкость переднего плана объясняет характерную выпуклость изображения высококачественных объективов. Осторожно: ради незначительного увеличения трехмерности вы можете сделать изображение слишком жестким.

Более светлые объекты кажутся более удаленными. Связано это с тем, что в природе мы видим дальние объекты сквозь толщу рассеивающего свет воздуха; дальние горы кажутся светлыми. В пейзажной съемке следует, поэтому, с осторожностью относиться к расположению светлых объектов на переднем плане.

Осветлите дальние объекты. Чем удаленнее, тем больше они сливаются с яркостью и тоном неба. Обратите внимание, что горизонтальные объекты (земля, море) лучше освещаются, чем вертикальные (стены, деревья), поэтому не переусердствуйте с осветлением последних. В любом случае, объекты должны оставаться заметно менее светлыми, чем небо.


Хорошо, если вы заметили, что осветление - это другой способ снизить контраст по яркости заднего плана. Чуть затемните передний план для усиления эффекта выпуклости.

Казалось бы, в интерьере все наоборот. Если на улице глаз привык к тому, что даль светла, то в комнате свет зачастую сосредоточен на человеке, а интерьер погружен в темноту; мозг привык к освещению переднего плана, а не заднего. На интерьерных изображениях с малой глубиной сцены, в отличие от пейзажных, освещенная модель выступает из темного фона. Но есть и противоположный фактор: 99% своей эволюции, человек наблюдал перспективу на открытой местности, и с появлением комнат мозг еще не успел перестроиться. Вермеер предпочитал светлый фон для портретов, и они у него действительно выпуклые. Освещение вертикального фона, рекомендуемое в фотографии, не только отделяет от него модель, но и за счет осветления фона придает изображению небольшую трехмерность. Здесь мы сталкиваемся с тем, что мозг анализирует расположение объектов по нескольким факторам, и они могут быть конфликтующими.

Интересно выглядит студийное освещение, в котором световые пятна лежат на удаленных от камеры зонах модели. Например, подсвечена та грудь, которая дальше от камеры.

Снизьте насыщенность цвета на удаленных объектах: из-за толщи разделяющего нас воздуха, дальние горы десатурированы почти до уровня монохрома и покрыты синей дымкой. Насыщенность переднего плана можно увеличить.

Поскольку желтый цвет светлый, а синий и красный - темные, то цветовой контраст заодно является и контрастом по яркости.

Десатурируя удаленный фон, не дайте ему пропасть из виду. Часто, напротив, нужно поднять насыщенность дальнего плана, чтобы проявить его. Это важнее трехмерности.

Много советов по трехмерности фотографии посвящено температурному контрасту. На самом деле, этот эффект очень слабый, легко перебивается контрастом по яркости. К тому же, температурный контраст назойлив, бросается в глаза.

Очень удаленные предметы кажутся более холодного цвета, потому что воздух поглощает теплый оранжевый свет. Фотографируя модель на пляже на фоне кораблей, расположенных у горизонта, в пост-обработке снизьте цветовую температуру далекого моря и судов. Модель в красном купальнике выступает из синего моря, а модель в желтом свете уличного фонаря - из синеватых сумерек.

В этом заключается раздельное тонирование: модель делаем теплее, фон - холоднее. Мозг понимает, что в одной плоскости разных цветовых температур не бывает, и воспринимает такое изображение трехмерным, на котором модель выступает из фона. Раздельное тонирование придает глубину и пейзажам: сделайте передний план теплее, задний холоднее.

Важное исключение из раздельного тонирования: на восходе и закате, удаленный фон вовсе не холодный, а теплый, с желтыми и красно-оранжевыми тонами. Очевидное решение - использовать белокожую модель в фиолетовом купальнике - не работает, потому что закатный свет наносит теплый оттенок и на тело модели.

Обобщим: для придания фотографии трехмерности на основе атмосферных эффектов, необходимо противопоставить передний и задний планы. Основное противопоставление - по обычному контрасту: передний план контрастный, задний - слабоконтрастный. Второе противопоставление - по резкости: передний план резкий, задний - размытый. Третье противопоставление - по светлости: передний план темный, задний - светлый. Четвертое противопоставление - по насыщенности: цвета переднего плана насыщены, заднего - десатурированы. Пятое противопоставление - по температуре: передний план теплый, задний - холодный.

Перечисленные факторы нередко разнонаправленны. Желтый цвет ярче синего, а светлые предметы кажутся дальше темных. Естественно было бы ожидать, что желтый цвет отступает, а синий - приближается к зрителю. На самом деле, наоборот: теплый цвет выступает из холодного фона. То есть, цвет оказывается более сильным фактором, чем яркость. Что, по размышлении, и не удивительно: желтый и красный хорошо различимы только вблизи, и зритель не ожидает их встретить на большом расстоянии.

Итог: удерживайте задний план низкоконтрастным, размытым, светлым, десатурированным, синеватым. И будьте готовы к тому, что зритель, привыкший к гипертрофированному 3D кинофильмов, сочтет созданную вами трехмерность едва заметной или отсутствующей.

В портретной съемке, лучше полагаться на проверенный эффект chiaroscuro - игру светотени на лице модели, которая сделает изображение достаточно выпуклым. В жанровой съемке, перспектива дает наиболее заметный эффект трехмерности. В натюрморте, основным фактором будет пересечение (наложение) предметов.

Не увлекайтесь перспективой; она лишь фон для фронтальной плоскости, на которой трепещет ваше изображение. В современной живописи, далекой от реализма, перспектива не в почете.

Скачать книгу целиком:

Трехмерные и двумерные изображения: модели, алгоритмы и области анализа

П.А. Чочиа

Аннотация - Рассматриваются вопросы модификации двухмасштабной модели и алгоритмов обработки при переходе от двумерных к трехмерным изображениям. Показаны изменения области анализа, алгоритмов фильтрации, декомпозиции изображений и обнаружения объектов. Предложены быстрые алгоритмы вычисления локального среднего и порядковых статистик по скользящему окну для 3Б-изображений.

Ключевые слова - Обработка изображений, трехмерное изображение, модель изображений, алгоритм обработки, область анализа, быстрые алгоритмы.

I. Введение

Когда употребляют термин «трехмерное изображение» зачастую понимают совершенно различные виды данных -, основные из которых следующие.

1. Данные, задаваемые функцией трех координат и являющиеся гомеоморфным отображением некоторого объемного участка трехмерного пространства, включая все содержащиеся в нем объекты.

2. Стереоскопическое изображение, состоящее из пары двумерных изображений, за счет диспаратности дающих наблюдателю представление о расположении объектов.

3. Изображение, являющееся проекцией трехмерной сцены (например, аксонометрической), позволяющее оценить форму и расположение объектов, но при этом остающееся двумерным.

4. Двумерное изображение, каждая точка которого соответствует некоторым координатам в трехмерном пространстве, например дальности или рельефу.

5. Особым способом сформированные изображения, создающие образы объектов, например голограммы.

6. Видеопоследовательности, содержащие набор кадров объектов. Такие данные могут представляться в виде трехмерного массива, но одна из координат при этом является не пространственной, а координатой времени.

Далее под трехмерным или ЗБ-изображением (непрерывным или дискретным) будут пониматься изображения исключительно первого типа. По существу, 3D-изображение представляет собой расширение обычного 2D-изображения путем добавления еще одного пространственного измерения.

Способы формирования трехмерного изображения могут быть различными; наиболее известным является

П.А. Чочиа, к.т.н., с.н.с., Институт проблем передачи информации РАН, г. Москва. (e-mail: [email protected])).

томографическое сканирование - рентгеновская компьютерная томография или магнитно-резонансная томография. Возможно получение 3D-изображения в результате сейсморазведки при геологических исследованиях, в микроскопии при использовании объектива с переменным фокусным расстоянием, при компьютерном моделировании трехмерных объектов и сцен, или каким-то иным образом.

Обработка и анализ трехмерных изображений играют в настоящее время существенную роль во многих областях исследований, особенно в медицине и геологии. В настоящей работе рассмотрены вопросы расширения модели двумерного изображения и применения ее к трехмерным изображениям, вопросы модификации операций частотной и пространственной фильтраций при переходе в 3D, вопросы сглаживания и декомпозиции изображений ,, фильтрации помех, обнаружения контуров и объектов, а также вычислительные аспекты реализации некоторых алгоритмов для трехмерных изображений .

Большинство алгоритмов фильтрации при переходе от двумерных к трехмерным сигналам модифицируются сравнительно просто. Это будет показано на примерах наиболее распространенных алгоритмов, основанных на частотной и пространственной фильтрациях.

II. Особенности трехмерного изображения В дискретном виде 3D-изображение представляется массивом X = размерами MxNxK. Как и в 2D, значение каждого элемента xmnk есть квантованное на (xmax+1) градаций значение логарифма яркости (энергии) 0 < xmnk < xmax, которое для краткости будем называть просто яркостью. Дискретный элемент 3D-изображения принято называть вексель. Трехмерное изображение, отображающее некоторую сцену, можно рассматривать состоящим из плотно упакованных связных трехмерных областей (объектов), соответствующих деталям сцены. Областью или объектом будем называть максимальное по размеру связное множество элементов изображения, имеющих близкие, возможно плавно меняющиеся значения яркости. Области могут соприкасаться произвольным образом, в том числе одна область может быть полностью окружена другой. На границах соседних областей значения яркости должны заметно различаться. Не соприкасающиеся области могут иметь произвольные, в том числе и совпадающие яркости. Пространственные границы между соседними областями, как объектами различающейся яркости, называют контурами. 3D-изображения характеризуются

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

следующими свойствами:

3D-изображение - совокупность объектов, плотно заполняющих пространство изображения;

Контуры в 3D-изображении - пространственные границы между объектами;

Сечение 3D-изображения плоскостью и проекция его на плоскость любого направления дают двумерный сигнал со всеми свойствами обычного 2D-изображения.

III. Области анализа

Область анализа - подмножество исходных данных, используемое в оценке параметров. Методы, в которых для каждой точки (или малых фрагментов) изображения используются свои параметры обработки, определяемые по ограниченной и, как правило, центрированной в данной точке области анализа, называют локальными.

Рассмотрим связное множество элементов xijle Vd(xmnk) таких, которые отстоят от центрального элемента xmnk на расстояние не далее, чем d и вместе составляют фигуру некоторой задаваемой формы. При d < 2a3 множество Vd(xmnk), окружающее центральный элемент (воксель) xmnk, будем называть окрестностью и обозначать Vmnk, а при d >>1 - фрагментом и обозначать Wmnk. Отметим, что в зависимости от выполняемых операций сам центральный элемент xmnk может как принадлежать, так и не принадлежать Vd(x). Соответственно, операции вида

ymnk = f{xijl 1 xijl e Vd(xmnk) }, (1)

в которых результат в каждой точке (m,n,k) зависит лишь от значений элементов xijl, входящих в Vd(xmnk), называются локальными операциями.

При переходе из 2D в 3D варианты симметричных окрестностей и соседства элементов претерпевают следующие изменения. Окрестность из 2x2 элементов (4 пикселя) становится окрестностью из 2x2x2 элементов (8 вокселей), в которой каждый воксель соседствует с каждым. В двумерной окрестности из 3x3 элементов (9 пикселей), как известно, можно рассматривать два варианта соседства элементов: 4-соседство (только по сторонам пикселей) и 8-соседство (по сторонам и вершинам пикселей) . Аналогом первого из них в 3D будет окрестность с 6-соседством вокселей (Рис. 1,а). Аналогом второго - окрестность с 26-соседством вокселей (Рис. 1,в). Возможен промежуточный вариант с 18-соседством вокселей (Рис. 1,б). Выбор варианта окрестности обычно определяется контекстом задачи и используемым алгоритмом.

Рис. 1. Окрестности и соседства вокселей в 3D: а) 6-соседство; б) 18-соседство; в) 26-соседство.

В некоторых случаях нас интересует не весь набор точек, попадающих в область анализа, а лишь некоторое его подмножество, включающее центральный элемент, которое будем называть областью принадлежности. Способ выбора области принадлежности зависит от

задачи; некоторые варианты рассмотрены в разделе VI.

IV. Двухмасштабная многокомпонентная модель

ТРЕХМЕРНОГО ИЗОБРАЖЕНИЯ

Для формулировки сведений об основных свойствах изображений - топологических (форм, размеров областей и контурных перепадов между ними) и статистических (взаимосвязи значений элементов) необходима соответствующая модель изображения. Чтобы быть полезной, она должна описывать свойства изображений на расстояниях, обусловленных особенностями задач, а также давать возможности для построения эффективных алгоритмов обработки и анализа изображений.

Статистические взаимосвязи элементов изображения, находящихся на больших расстояниях, существенно отличаются от аналогичных свойств близлежащих элементов и их не удается описать одними и теми же соотношениями. Для обычного двумерного изображения была разработана двухмасштабная многокомпонентная модель, достаточно хорошо описывающая взаимосвязи элементов и на малых расстояниях в несколько шагов дискретизации, и на больших - соразмерных размерам объектов изображения . Она с успехом может быть перенесена на 3D-изображения.

Значения элементов 3D-изображения X = при этом будут представляться в виде суммы статистически независимых компонент:

xmnk Smnk ^ tmnk + ^mnk (2)

Первый член суммы - кусочно-гладкая компонента Smnk, определяющая уровни яркости протяженных областей изображения; tmnk - текстурно-детальная компонента, несущая информацию о текстуре и мелких деталях; £,mnk - шумовая компонента, определяемая шумами регистратора, аналого-цифрового преобразователя и др. Все компоненты предполагаются

независимыми и аддитивными, а tmnk и £,mnk - нормально распределенными и несмещенными.

A. Масштаб малого размера

На масштабе малого размера (масштабе элементов окрестности) рассматривается сравнительно небольшое связное множество элементов, расположенных на расстоянии нескольких шагов дискретизации. Как и в двумерной модели , элементы трехмерного изображения разделяются на два непересекающихся множества: попадающие на граничные участки (контурные) и не попадающие (внутренние), составляющие вместе полное изображение. Окрестность Vmnk элемента xmnk рассматривается как группа из R элементов xrmnk e Vmnk, r = 1,...,R, ближайших к xmnk, и попадающих в то же множество (контурное или внутреннее), что и элемент xmnk (Рис. 2).

Методом наименьших квадратов проводится гиперплоскость, наиболее близкая значениям элементов из Vmnk, составляющая с гиперплоскостью, ориентированной вдоль осей координат MNK, некоторый угол, величина и направление которого в точке (m,n,k) характеризуется вектором gmnk. В точке r окрестности проведенная гиперплоскость отличается от значения

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

xrmnk на случайную величину yrmnk . Такое представление

позволяет связать значения элементов окрестности

XLk ^ Vmnk фоРМУлой:

Xmnk ^mnk + Р gmnk + У mnk , (3)

где pmnk - значение проведенной гиперплоскости в центральной точке окрестности (m,n,k), pr - расстояние между центральным элементом Xmnk и xrmnk, grmnk - величина проекции gmnk на вектор из Xmnk в xrmnk, а yrmnk -

случайная величина.

Вводится понятие контурной маски E = : emnk = 1 для контурных и emnk = 0 для внутренних элементов. Обозначая для контурных и внутренних элементов grmnk

через Vmnk и Vmnk , а Ymnk через Cmnk и hmnk

соответственно, представим grmnk и jrmnk в виде сумм

grmnk = emnk R1 .

3. Из элементов Vmnk выбираются z таких xrmnk e V,

(r = 1,..., z), что попадают в интервал (XV - AV, XV + AV), где AV - его полуширина. По значениям Xrmnk из данного интервала, подсчитывается среднее :

Xmnk A(V mnk , Xmnk ,

A(Vmnk , Xmnk , n , А) = - Ё X

где XV - AV < Xmnk < XV + AV.

4. Аналогично п. 2, по гистограмме фрагмента H"Wnk и

W r»W r>W/ W/т 3\

заданному n находятся значения R1 = R (n /L) и rw = rw(1 - nW/L3). Значение XW находится сравнением

X„„k с RW и RW:

mnk, если RW < Xmrk < RV ; XW = RW ,

RW , если X„„k > RW

если Xmnk < R1W ; и X"

5. Сглаженное значение Smnk находится как медиана по усеченной гистограмме фрагмента HmWnk - той ее части,

которая расположена в интервале (X - A , X + A):

Smnk = med(Wm„k, Xmnk , nW, AW).

Рис. 4. Результат декомпозиции: исходное изображение (слева), сглаженная компонента S„n (справа) и графики отмеченной строки.

Полученное значение Smnk считается искомой сглаженной компонентой. Упрощенный вариант данного алгоритма был позже опубликован в под названием билатеральная фильтрация. Пример декомпозиции двумерного изображения размерами 256x256 элементов с фрагментом сглаживания Wmnk размерами 15x15 элементов показан на Рис. 4.

E. Обнаружение объектов заданного объема В показано, что изложенный выше алгоритм декомпозиции можно использовать для обнаружения объектов на изображении. Аналогично 2D-изображе-ниям, для которых решается задача обнаружения объектов по их площади, в трехмерной модификации ставится задача обнаружения объектов по их объему.

По аналогии с двумерной, трехмерная задача также допускает формулировку в трех вариантах: обнаружение объектов с объемом (т.е. числом элементов) N j меньше заданного T1, больше заданного T2, и обнаружение объектов, имеющих объем в интервале T1 < N] < T2.

1) Обнаружение объектов с N1 > T Предполагается, что изображение состоит из достаточно ровного фона (большая область U0), на которой имеется набор небольших областей U1,...,UJ, отстоящих друг от друга достаточно далеко, и можно выбрать некоторый размер фрагмента L (L3/2 > T) такой, что в любой фрагмент Wmnk попадает не более одной области c N] > T, либо несколько меньших, но при условии EN1 < T (U1 _ W). В п. 5 алгоритма декомпозиции (25) выберем nW= T, a R"W = R(T/L3) и R2W = R(1-T/L3). Обработкой изображения с данными значениями R1W и R2W получим:

т.е. сглаженную компоненту исходного изображения, на которой остались области с N] > T, обнаруживаемые детектором со значением порога S(U0) ± 5, где S(U0) - средняя яркость фона, а 5 < mini{IS(U1) - S(U 0)l}; (S(U 1) - яркости соответствующих областей).

2) Обнаружение объектов с N1 < T

Сглаженная компонента Smnk, в (25) содержит лишь области с N1 > T, а области с N1 < T содержатся в разностной компоненте tmn = (Xmn - ^mn) - Smn. Детекция объектов с N1 < T достигается пороговым обнаружением в точках, где ltmnl > 5 (5 - порог обнаружения).

3) Обнаружение объектов с Tj < N] < T2 Возможны два варианта решения.

В первом случае сначала выберем nW = T1. Тогда сглаженная компонента Smnk в (25) будет содержать объекты с N] > T1. Осуществим повторную ее обработку алгоритмом (25) с nW = T2 (T2 > T1). Очевидно, во вновь полученной сглаженной компоненте S’mnk будут содержаться лишь объекты с N1 > T1. Взяв разность ymnk = ISmnk - S’mnkl получим сигнал, содержащий объекты в диапазоне T1 < N] < T2. Недостаток данного решения - алгоритм получается двухпроходовым.

Второй вариант. Обратим внимание, что при анализе гистограмм по окрестности и фрагменту используются два разных порога (nV и nW). Выберем размеры окрестности l и фрагмента L больше обычного - такими, чтобы l3 > 2T1 и L3 > 2T2. Задав R1V и RV, как

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

RV = RV(T1/l2) и RV = RV(1 - ТУ/2), после операции (24) будем иметь xmnk, которое уже не содержит области с N] < Т1. Далее в п. 5 алгоритма декомпозиции, при анализе HW, зададим RW и R2W как RW = RW(T2/L3) и rw = rw(1 - t2/l3). Получив значение Smnk в (25), возьмем разность ymnk = I xmnk - Smnk\, на которой объекты выделяются пороговым обнаружением.

Отметим, что как понятие площади в двумерном случае, так и понятие объема в трехмерном варианте алгоритма используются в несколько необычном смысле - как «локальный» объем, т.е. объем той части объекта, которая попадает внутрь фрагмента Wmnk.

VII. Некоторые вычислительные алгоритмы

A. Сумма по прямоугольному параллелепипеду Введем обозначение для суммы по фрагменту 2Б-изображения:

т.е. S(j)(mn) - сумма значений элементов xuv, попадающих в прямоугольный фрагмент, диагональные точки которого имеют координаты (i,j) и (m-1,n-1). Обратим внимание, что фрагмент при этом не включает точку с координатами (m,n) и соответствующие ей строку и столбец. Аналогично для трехмерного изображения, S(ijl)(mnk) - сумма значений элементов xijl в прямоугольном параллелепипеде с координатами углов (i,j,l) и (m-1,n-1,k-1):

Для двумерного изображения классический способ вычисления суммы S(mn)(m+Hn+L) по скользящему прямоугольному фрагменту размерами HxL элементов при переходе от элемента (m,n) к элементу (m,n+1) сводится к формуле

S(m,n+1)(m+H,n+L+1) S (m,n)(m+H,n+L) S(m,n)(m+H,n+1) +S(m,n+L)(m+H,n+L+1), (26)

где последние два члена - суммы элементов по левому (удаляемому) и правому (добавляемому) столбцам фрагмента. Алгоритм требует 4 операции независимо от размеров фрагмента - 2 операции в выражении (26) и две операции на пересчет каждой из сумм по столбцу S(m,n)(m+H,n+V) при переходе от строки m к строке m+1. Дополнительно требуется N ячеек для хранения сумм по столбцам.

При переходе к 3Б-изображению, формула (26) будет модифицирована для скользящего прямоугольного параллелепипеда размерами HxLxJ:

S(m,n,k+1)(m+H,n+L,k+J+1) S(m,n,k)(m+H,n+L,k+J) S(m,n,k)(m+H,n+L,k+1)+ + S(m,n,k+J)(m+H,n+L,k+J+1), (27)

где последние два члена - суммы элементов по левой (удаляемой) и правой (добавляемой) граням

параллелепипеда. Данный алгоритм требует уже 6 арифметических операции независимо от размеров фрагмента - 2 операции в выражении (27), две операции на пересчет каждой из сумм по граням и две на пересчет сумм по столбцам. Кроме того, требуется K

ячеек для хранения массива сумм по граням и NxK ячеек для хранения сумм по столбцам.

Для двумерного изображения известен и другой алгоритм вычисления суммы по прямоугольнику произвольного размера. Пусть для каждой точки (m,n) подсчитаны суммы Smn = S(0,0)(m,n) по прямоугольнику с диагональными элементами x00 и xm-1,n-1. Тогда сумма S(ij)(mn) значений элементов внутри прямоугольника с угловыми координатами (i, j) и (m-1,n-1) будет:

S(ij)(mn) Smn Sm,j Si,

что в среднем для каждого элемента изображения требует 2 операции для вычисления суммы Smn и 3 операции для вычислений по формуле (28). Однако для хранения сумм Smn требуется уже MxN ячеек, равное размеру изображения. Преимуществом является то, что за те же 3 операции можно вычислять S(ij)(mn) для любых значений координат, а не только по скользящему фрагменту.

Алгоритм (28) также может быть модифицирован для трехмерного изображения. Пусть для каждой точки (m,n,k) подсчитаны суммы Smnk по прямоугольному параллелепипеду с диагональными элементами x000 и xm-1,n-1,k-1, т.е. Smnk = S(ooo)(mnk). Нетрудно показать, что в таком случае сумма S(ijl)(mnk) значений элементов внутри параллелепипеда с угловыми координатами (i, j, l) и (m-1,n-1,k-1) вычисляется при помощи следующей операции:

S(ijl)(mnk) = Smnk -Smjk -Smnl -Sink +Smjl +Sijk +Sinl -Sijl. (29)

Таким образом с учетом того, что для вычисления каждого из значений Smnk требуется 3 арифметических операции, для вычисления суммы S(ijl)(mnk) для каждого элемента трехмерного изображения потребуется в среднем 10 арифметических операций. Объем дополнительно требуемой памяти составит MxNxK ячеек с разрядностью, достаточной для значений сумм Smnk.

Аналогично можно находить дисперсии по фрагменту D(ijl)(mnk), вычисляя значения сумм квадратов S(mnk)(x2) для каждой из точек (m,n,k) и для прямоугольного параллелепипеда S(ijl)(mnk)(x2), и затем пользуясь формулой

D(ijl)(mnk) = {S(ijl)(mnk)(x) - (S(ijl)(mnk)) }/N(ijl)(mnk), (30)

где S(ijl)(mnk)(x2) - сумма квадратов значений элементов, попадающих в параллелепипед, а общее число точек в параллелепипеде равно N(ijl)(mnk) = (m-i)x(n-j)x(k-l).

B. Порядковые статистики по прямоугольному параллелепипеду

Основой для вычисления порядковых статистик по фрагменту W как 2D- так и 3Б-изображения служит гистограмма распределения значений яркости по этому фрагменту hW(x), а также ее интегральная характеристика FW(x):

FW (x) = Z hW (i) ; FW(xmax) = NW, (3 1)

где xmax - максимально возможное значение яркости, а NW - число точек во фрагменте W. Порядковые статистики вида RW(n), где 0 < n < NW, представляют собой зависимость:

RW(n) = z, если FW(z-1) < n < FW(z). (32)

Алгоритм скользящего вычисления гистограммы по

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

фрагменту строится аналогично формулам (26) и (27), т.е. при смещении фрагмента к следующей точке производится удаление точек на одной грани фрагмента и добавление точек на противоположной грани . В двумерном случае алгоритм скользящего вычисления гистограммы по фрагменту при переходе от точки (m,n) к соседней точке (m,n+1) требует в среднем 2H числа операций (H - число строк во фрагменте). В трехмерном случае при переходе от точки (m,n,k) к точке (m,n,k+1) потребуется уже 2HxL операций, где HxL - число точек в грани параллелепипеда, перпендикулярной направлению смещения K.

В трехмерном случае число требуемых операций растет пропорционально произведению HxL. Однако, если (HxL) > (xmax+1), то вместо операций со значениями отдельных точек выгодно заранее сформировать гистограммы для граней параллелепипеда hj)(mnk+1)(x), а

затем осуществлять операции вычитания и прибавления таких гистограмм:

hW (x) = hW (x) - hF (x) +

h(i,j,k+1Xm,n,k+J+1)(x) h(ijk)(m,n,k+J)(X) h(ijk)(m,n,k+1)(x)

H(i,j,k+J)(m,n,k+J+1)(X) ,

где J - размер фрагмента в направлении смещения K. Действия по формуле (33) требуют в среднем 2(xmax+1) арифметических операций на одну точку изображения независимо от размера параллелепипеда. Для пересчета гистограмм по граням параллелепипеда hfjk)(mnk+1)(x)

нужно дополнительно в среднем 2L операций на точку и (xmax+1)xK ячеек памяти для хранения K гистограмм.

Число операций (xmax+1), требуемое для прибавле-ния/вычитания каждой из гистограмм по граням параллелепипеда hFjk)(mnk +1)(x), можно уменьшить, если

воспользоваться пространственной корреляцией обрабатываемых данных. На участках с медленным изменением яркости, которых на реальных изображениях обычно большинство, размах значений элементов сравнительно невелик - в несколько раз меньше полного диапазона в (xmax+1) градаций. Добавив к каждой из гистограмм hFjk)(mnk +1)(x) по 2 ячейки для

запоминания минимального и максимального значений распределения, и, соответственно, обрабатывая лишь указываемый диапазон градаций, удается дополнительно в несколько раз сократить общее число операций.

VIII. Заключение

Рассмотрены вопросы модификации двумерных модели и алгоритмов обработки изображений в применении к трехмерным изображениям. Показаны варианты изменения области анализа, алгоритмов фильтрации, декомпозиции изображений и обнаружения объектов, которые сравнительно несложно модифицируются при переходе от 2D- к 3Б-изображениям. Предложены вычислительные алгоритмы, сокращающие количество операций при определении значений среднего и порядковых статистик по скользящему фрагменту для 3D- изображения.

Библиография

Toriwaki J., Yoshida H. Fundamentals of Three-Dimensional Digital Image Processing. New York: Springer, 2009.

Красильников Н. Цифровая обработка 2D и 3D изображений. СПб.: BHV-Петербург, 2011.

Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2012.

Чочиа П.А. “Двухмасштабная модель изображения”. В кн.

Кодирование и обработка изображений. М.: Наука, 1988, С. 69-87.

Чочиа П.А. Обработка и анализ изображений на основе двухмасштабной модели: Препринт ИППИ АН СССР. М.: ВИНИТИ, 1986.

Ахмед Н., Рао К. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980.

Chochia P.A. “Image Enhancement Using Sliding Histograms”. Computer Vision, Graphics, Image Processing, 1988, vol. 44, no. 2, pp. 211-229.

Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. Т. 1, 2.

Робертс Л. “Автоматическое восприятие трехмерных объектов”. В кн. Интегральные роботы. М.: Мир, 1973, С. 162-208.

Чочиа П.А. “Цифровая фильтрация импульсных помех на телевизионных изображениях”. Техника средств связи: сер. Техника телевидения, 1984, вып.1, C. 26-36.

Чочиа П.А. “Сглаживание изображения при сохранении контуров”. В кн. Кодирование и обработка изображений. М.: Наука, 1988, С. 87-98.

Чочиа П.А. “Некоторые алгоритмы обнаружения объектов на основе двухмасштабной модели изображения”. Информационные процессы, 2014, Т. 14, № 2, С. 117-136.

Lee J.S. “Digital Image Smoothing and the Sigma Filter”. Computer Vision, Graphics, Image Processing, 1983, vol. 24, no. 2. pp. 255-269.

Tomasi C., Manduchi R. “Bilateral filtering for gray and color images”. Proc. IEEE 6th Int. Conf. on Computer Vision, Bombay, India, 1998, pp. 839-846

Чочиа П.А. “Параллельный алгоритм вычисления скользящей гистограммы”. Автометрия, 1990, № 2, С. 40-44.

Чочиа П.А. “Модификация модели и алгоритмов обработки при переходе от двумерных к трехмерным изображениям.” В кн. IX

Международная научно-практическая конференция “Современные информационные технологии и ИТ-образование." Сборник избранных трудов. М.: МГУ, 2014, С. 820-833.

International Journal of Open Information Technologies ISSN: 2307-8162 vol. 2, no. 11, 2014

Three-dimensional and two-dimensional images: modification of image model, analysis area processing algorithms

Abstract - The specificities of three dimensional images are formulated. The adaptation of analysis area and two-scale image model to 3D-images is studied. The modifications of various image processing algorithms to 3D-images are demonstrated. Fast algorithms for calculating local average and order statistics in the moving window for 3D-images are proposed.

Keywords - Image processing, three-dimensional image, image model, image processing algorithm, analysis area, fast algorithms.

2D (two dimensions) – вид компьютерной графики. Такое изображение всегда будет выглядеть плоским, так как в нем используется только два измерения – ширина и высота. Используется для создания логотипов, карт, сайтов, рекламных баннеров, в играх и интерфейсах приложений, мультфильмах и видеофильмах. Несмотря на то, что 2D графика выглядит как плоское изображение, за счет теней можно добиться эффекта объемных объектов (но не фотореалистичности).

Макеты рекламных материалов, созданные для Museo Argentino de Ciencias Naturales (Музей естественных наук, Буэнос Айрес). Автор: Lucas Rod .


Видео для одного из проектов Rijksmuseum . Видеоряд включает в себя изображения 211 произведений из онлайн коллекции музея.


Интерактивная игра для детей о жизни динозавров, нарисованная в формате 2D-графики.

2D графика бывает трех видов:

  • Векторная графика: изображение представлено в виде геометрических форм, что дает максимальную точность построенного изображения. Такой формат картинки легко редактируется, масштабируется, поворачивается, деформируется, и позволяет имитировать трехмерность. Из недостатков вектора можно отметить отсутствие реалистичности и невозможность использования эффектов. Векторная графика подходит для рисования чертежей и схем, используется для масштабируемых шрифтов, деловой графики, для элементов брендбука (логотипы, декоративные узоры и т.п.), применяется для создания мультфильмов и различных роликов, а также в печати (обеспечивает высокое качество изображения).
  • Растровая графика: картинка формируется из точек различного цвета (так называемых пикселей), которые образуют строки и столбцы. Такие изображения обладают высокой реалистичностью, за счет возможности применения разнообразных эффектов. Недостатком растрового формата является слабая масштабируемость (при уменьшении или увеличении картинки теряется ее качество).
    Растровые форматы рисунков используются при создании веб-страниц в Интернете, мобильных приложений, любых интерфейсов, в цифровой живописи и т.д.

    Пример-иллюстрация разницы между изображением векторным и растровым.

    Пример музейного приложения для сенсорных устройств:

  • Фрактальная графика: изображение состоит из частей, которые в каком-то смысле подобны целому — увеличенные части объекта походят на сам объект и друг на друга. В компьютерной графике фракталы используются для построения изображений природных объектов, таких как деревья, кусты, горные ландшафты, поверхности морей и так далее.

    Интерактивная инсталляция в

Человек способен по двухмерной картинке составить весьма полное представление о расстояниях до изображенных объектов, их форме и размерах, и таким образом полностью воспринять трехмерный мир во всей его глубине. Как мы этого добиваемся?

Как известно человек с помощью глаз непосредственно видит именно двухмерную картинку. То, что мы видим можно запечатлеть, например, с помощью фотоаппарата, распечатать на листе бумаги (т.е. в двухмерной плоскости) и повесить на стену, таким образом изображение, поступающее к нам в мозг от глаз двухмерное.

Однако и глядя на реальные объекты, и на фотографии, и при просмотре видео, мы умудряемся вытянуть из данных двухмерных картинок столько информации, что они начинают нам казаться объемными, как-бы трехмерными. Мы очень хорошо воспринимаем относительное расположение объектов в пространстве только лишь за счет зрения. Вид зрения, который позволяет воспринять форму, размеры и расстояние до объектов называется – стереоскопическим зрением. Человек обладает таким зрением и добивается этого за счет следующих эффектов:

  • Бинокулярное зрение. Человек имеет два глаза. На сетчатке каждого из глаз формируется слегка различное двухмерное изображение одной и той же трехмерной сцены. На основе жизненного опыта и огромных вычислительных способностей, мозг сопоставляя эти два слегка различающиеся изображения, формирует представление о трехмерности картинки. Лучше всего этот эффект срабатывает при рассматривании близких объектов, таких расстояние до которых хоть как-то сравнимо с расстоянием между глазами. При рассматривании объектов, удаленных на расстояние более пяти метров, этот эффект уже почти не сказывается. Сразу также оговоримся, что в виду того, что бинокулярное зрение – это не единственный фактор, позволяющий видеть в 3D, и так как сфера его применения ограничена несколькими метрами, то отсутствие двух глаз не стало бы катастрофой для человека. Мы тем не менее смогли бы видеть в 3D, просто нам бы понадобилось больше жизненного опыта и времени, чтобы научиться применять остальные эффекты. Это утверждение подтверждается очень легко. Просто закройте один глаз. Ну что, перестали видеть в 3D? Нет!
  • Смещение объектов при движении наблюдателя. При движении наблюдателя картинка, которую он видит постоянно меняется, при этом близкие объекты меняют свое положение на этой картинке значительно быстрее, чем далекие, которые медленно изменяют свое положение в поле зрения наблюдателя. И опять-таки, большой жизненный опыт и вычислительные способности мозга, позволяют по скорости перемещения объектов в поле зрения хорошо воспринять расстояние до них. Кстати, фактически перемещением одного глаза на расстояние равное расстоянию между глазами, можно заменить бинокулярное зрение, ведь действительно, мозг в итоге сможет сопоставить те же две картинки, что и сразу от двух глаз. Однако этот метод требует больших усилий и постоянного движения, а также картинки ведь будут запечатлены не в один и тот же момент времени, т.е. могут быть уже разными. Поэтому бинокулярное зрение всё же очень полезная опция, которая очень помогает при работе с близкими объектами, чем человек обычно и занимается.
  • Жизненный опыт. Большинство людей хорошо представляют размеры многих привычных объектов, таких как деревья, другие люди, автомобили, окна, двери и так далее. Обладая этими знаниями, можно неплохо оценить расстояние до одного из таких объектов (а значит и до тех объектов, которые расположены рядом), в зависимости от того, какую часть от общего поля зрения они занимают. Например, Вы сразу догадаетесь, что девочка на фото ниже, расположена значительно ближе к наблюдателю чем башня до верхушки которой она якобы дотягивается...
  • Задымленность далеких объектов. Атмосфера всё же имеет определенную степень непрозрачности. Поэтому очень далекие объекты выглядят задымленными. Так по степени задымленности можно определять какой из далеких объектов расположен дальше, а какой ближе к наблюдателю. Это очень полезный эффект, ведь для далеких объектов плохо работают остальные способы построения трехмерного изображения.
  • Перспектива, тени и освещение. По конфигурации теней и степени освещенности той или иной части предмета, на основе большого жизненного опыта мозг хорошо воспринимает форму объектов. Перспектива – эффект в соответствии с которым, например, две параллельные линии в пространстве сходятся в точку на изображении при большом удалении от наблюдателя. Мозг умеет очень хорошо воспринимать информацию, поступающую к нему за счет этого эффекта.
  • Способность глаза сфокусироваться только на одной дальности. Глаз, как и любой оптический прибор не может видеть одинаково хорошо картинку во всей её глубине, он может сфокусироваться только на некоторой конкретной дальности. Таким образом, наиболее четкими нам видятся объекты, на которых мы в данный момент сфокусированы, а более близкие и дальние объекты кажутся слегка размытыми. Мозг владеет информацией о том, на какой дальности в данный момент сфокусированы глаза. Так фокусируя взгляд на разных дальностях мы способны как бы просканировать всё пространство во всей его глубине.
  • Близкие объекты закрывают дальние. Этот очевидный эффект хотя и кажется очень простым, тем не менее вносит большой вклад в построение трехмерной картинки. Ведь нет ничего проще, чем понять, что один объект находится дальше другого, если он им частично закрыт.
  • Изображение поясняющее пункт №3.

    Изображение поясняющее пункт №4.

    Изображение поясняющее пункт №5.

    Изображение поясняющее пункт №6.

    После того, как мы проговорили все эффекты на основе которых наше зрение позволяет нам воспринимать трехмерную картинку можно также сделать одно небольшое замечание насчет 3D-кино.

    Дело в том, что в любом кино используются все перечисленные выше эффекты, кроме самого первого – «бинокулярного зрения». Ну а в 3D-кино, за счет специальных технологий добавляется и бинокулярность. При просмотре фильмов в 3D для каждого глаза за счет очков формируется слегка различное изображение.

    Однако нужно отметить, что это не вносит существенного улучшения в картинку. Ведь как уже говорилось, и с помощью одного глаза, имея большой жизненный опыт, можно фактически без потери качества видеть всю глубину картинки (за счет остальных шести эффектов, используемых в любом кино).

    Кроме того, бинокулярное зрение полезно на небольших расстояниях, а в фильмах зачастую мы наблюдаем широкие сцены, а не рассматриваем маленькие объекты с близкого расстояния, поэтому данный эффект частенько вообще не заметен.



    Похожие статьи
     
    Категории