Obrázok ako dvojrozmerné pole údajov. 2D grafika

04.02.2019
]

Prvé počítače 40-tych rokov 20. storočia („ABC“ (1942), „ENIAC“ (1946), „EDSAC“ (1949), „MESM“ (1950) boli vyvinuté a používané výhradne na výpočty a nie mať samostatné grafické nástroje. Už vtedy sa však niektorí nadšenci pokúšali použiť tieto počítače prvej generácie na vákuových trubiciach na získavanie a spracovanie obrázkov. Programovaním pamäte prvých modelov počítačov a zariadení na výstup informácií postavených na báze matice elektrických lámp bolo možné získať jednoduché vzory. Žiarovky sa zapínali a vypínali v určitom poradí a vytvárali obrazy rôznych postáv.

Nakoniec 40-te roky a skoro 50-te roky, začali používať mnohé počítače katódové trubice (CRT) vo forme osciloskopov, príp Williamsove trubice, ktoré sa používali ako RAM. Teoreticky by sa zápisom 0 alebo 1 v určitom poradí do takejto pamäte mohol zobraziť nejaký obrázok na obrazovke, ale v praxi sa to nepoužívalo. Avšak v roku 1952 Britský inžinier Alexander Douglas (Alexander Shafto "Sandy" Douglas) napísal vtipný program " OXO"(Tic-tac-toe) pre programovateľný počítač EDSAC (1949), ktorý sa stal prvou počítačovou hrou v histórii. Obraz mriežky a núl s krížikmi bol vytvorený naprogramovaním Williamsovej trubice alebo nakreslený na susednej CRT.

V 50. rokoch výpočtové možnosti počítačov a grafické možnosti periférií neumožňovali kresliť vysoko detailné obrázky, ale umožňovali zobrazovať obrázky znak po znaku na obrazovkách monitorov a typických tlačiarňach. Obrázky na týchto zariadeniach boli vytvorené z alfanumerických znakov ( grafika postavy, neskôr prišlo meno ASCII grafika a ASCII čl). Je to jednoduché: rozdiel v hustote alfanumerických znakov a zvláštnosti ľudského videnia: nevnímanie detailov obrazu z veľkej vzdialenosti umožnilo vytvárať kresby a pseudografické objekty na počítači. Podobné obrázky pred príchodom počítačov na papieri vytvorili pisári na písacích strojoch koncom 19. storočia.

V roku 1950 nadšenec Benjamin Laposky (Ben Laposky), matematik, umelec a kresliar, začal experimentovať s obrazovkou osciloskopu a vytváral zložité dynamické postavy - oscilácie. Tanec svetla bol vytvorený tým najzložitejším nastavením na tomto katódovom zariadení. Na zachytenie záberov sa používala vysokorýchlostná fotografia a špeciálne šošovky, neskôr sa pridali pigmentované filtre, ktoré obrázky vyplnili farbou.

V roku 1950 vo vojenskom počítači Víchrica-I(podľa Russian Whirlwind, Hurricane), zabudovaný do systému americkej protivzdušnej obrany SAGE, bol monitor prvýkrát použitý - ako prostriedok na zobrazovanie vizuálnych a grafických informácií. [ ]

V roku 1955 v laboratóriu v Massachusetts Technologický inštitút(MIT) bol vynájdený svetelné pero. Svetelné pero je vstupné zariadenie počítača citlivé na svetlo, v podstate nautilus, ktoré sa používa na výber textu, kreslenie obrázkov a interakciu s prvkami používateľského rozhrania na obrazovke počítača alebo monitore. Pero funguje dobre iba s monitormi CRT vďaka spôsobu, akým tieto monitory skenujú obrazovku, čo je jeden pixel po druhom, čo umožňuje počítaču sledovať očakávaný čas skenovania elektrónovým lúčom a určiť polohu pera na základe časová pečiatka posledného skenovania. Na hrote pera sa nachádza fotobunka, ktorá vysiela elektronické impulzy a súčasne reaguje na špičkovú žiaru zodpovedajúcu okamihu prechodu elektrónového lúča. Stačí synchronizovať impulz s polohou elektrónovej pištole, aby ste presne určili, kam pero smeruje.

Svetelné perá sa používali hlavne vo výpočtových termináloch v 60. rokoch. S príchodom LCD (LCD) monitorov v 90. rokoch sa prakticky prestali používať, pretože na obrazovkách týchto zariadení sa práca svetelného pera stala nemožnou.

V roku 1957 inžinier Russell Kirsch (Russell A. Kirsch) z amerického Národného úradu pre normy vynájdený pre počítač SEAC prvý skener a dostal naň prvý digitálny obrázok – naskenovať fotografiu malé dieťa, Waldenov vlastný syn. [ ]

V 60-tych rokoch XX storočia začalo to skutočné rozmach počítačovej grafiky. S príchodom nových výkonných počítačov s monitormi na báze tranzistorov (2. generácia počítačov) a neskôr mikročipov (3. generácia počítačov) sa počítačová grafika stala nielen sférou nadšencov, ale aj serióznym vedeckým a praktickým smerom vo vývoji počítačových technológií. Objavili sa prvé superpočítače ( SVS 6600 a Cray-1), ktoré umožnili pracovať nielen s rýchlymi výpočtami, ale aj s počítačová grafika na novej úrovni.

V roku 1960 dizajnový inžinier William Vetter (William Fetter) od Boeing Aircraft Corporation (angl. Boeing) prvýkrát predstavený pojem "počítačová grafika". Fetter, ktorý na funkčnom počítači nakreslil návrh kokpitu lietadla, sa rozhodol opísať druh svojej činnosti v technickej dokumentácii. V roku 1964 William Vetter vytvoril aj drôtený grafický model človeka na počítači a nazval ho „Boeing Man“, alias „Prvý človek“, ktorý sa neskôr používal v televíznych reklamách 60. rokov.

V roku 1962 programátor Steve Russell (Steve Russell) z MIT na počítači DEC PDP-1 vytvoril samostatný program s grafikou - počítačovú hru " vesmírna vojna!". Vytvorenie hry trvalo približne 200 človekohodín. Hra používala joystick a mala zaujímavú fyziku s peknou grafikou. Za prvú počítačovú hru bez grafiky však možno považovať program Alexandra Douglasa „OXO“ (Tic-Tac-Toe, 1952)

V roku 1963 počítačový" TX-2„Americký softvérový inžinier na MIT, priekopník počítačovej grafiky, Ivan Sutherland (Ivan Edward Sutherland) vytvoril softvérový a hardvérový komplex Skicár , ktorý umožňoval kresliť bodky, čiary a kruhy na tubu svetelným perom. Podporované boli základné akcie s primitívami: presúvanie, kopírovanie atď. V skutočnosti išlo o prvý vektorový editor implementovaný na počítači, ktorý sa stal prototypom moderných CAD (počítačom podporovaných konštrukčných systémov), ako sú moderný AutoCAD alebo Compass-3D . Program možno nazvať aj prvým grafickým rozhraním, ktoré vyšlo 10 rokov pred počítačom Xerox Alto (1973), a bolo ním ešte predtým, ako sa objavil samotný termín. Ivan Sutherland v roku 1968 vytvorené prototyp prvej počítačovej prilby pre virtuálnu realitu, nazýval ho „Damoklov meč“ analogicky so starogréckou legendou.

V polovici 60. rokov 20. storočia. došlo k rozvoju priemyselných aplikácií počítačovej grafiky. Áno, pod vedením T. Mofetta a N. Taylor firma Itek vyvinul digitálny elektronický kresliaci stroj ( ploter).

V roku 1963 programátor v Bell Labs Edward Zagek (Edward E. Zajac) hotový prvá počítačová animácia - pohyb družice okolo Zeme. Animácia ukázala teoretickú družicu, ktorá si pomocou gyroskopov udržala svoju orientáciu voči Zemi. Celé počítačové spracovanie sa uskutočnilo na počítačoch radu IBM 7090 alebo 7094 pomocou programu ORBIT. [ ]

V nasledujúcich rokoch boli vydané ďalšie, ale zložitejšie a významnejšie animácie: „Tesseract“ (Tesseract alias hypercube, 1965) od Michaela Knolla z Bell Labs, „Hummengbird“ (Hummingbird, 1967) od Charlesa Zuriho a Jamesa Shafersa, „ Kitty“ (1968) od Nikolaja Konstantinova, "Metadata" (Metadata, 1971) od Petra Foldersa atď.

V roku 1964 prepustený IBM 2250, prvý komerčný grafický terminál pre mainframe IBM/360.

AT 1964 spoločnosti General Motors spolu s IBM predstavil počítačom podporovaný návrhový systém DAC-1.

V roku 1967 profesor Douglas Engelbart (Douglas Carl Engelbart) navrhnutý prvá počítačová myš(ukazovateľ súradníc XY) a svoje schopnosti ukázal na výstave v meste San Francisco v roku 1968.

AT 1967 zamestnanec IBM Arthur Appel popisuje algoritmus na odstraňovanie neviditeľných hrán (vrátane čiastočne skrytých), neskôr tzv odlievanie lúča, východiskový bod modernej 3D grafiky a fotorealizmu.

V tom istom roku 1968 [ ] počítačová grafika zaznamenala s príchodom možnosti výrazný pokrok ukladať obrázky a zobrazovať ich na displeji počítača, katódová trubica . Objavili sa prvé rastrové monitory.

V 70. rokoch počítačová grafika dostala nový prielom vo vývoji. Objavili sa prvé farebné monitory a farebná grafika. Superpočítače s farebnými displejmi sa začali používať na vytváranie špeciálnych efektov vo filmoch (fantastický epos 1977 “ hviezdne vojny"riaditeľ George Lucas, fantastický horor "Cudzinec"(angl. "Alien") filmové štúdiá 20th Century Fox a riaditeľ Ridley Scott a neskôr podceňovaný sci-fi film z roku 1982 "Trón"(anglický Tron) štúdiá Walt Disney a riaditeľ Steven Lisberger). V tomto období sa počítače ešte zrýchlili, naučili sa kresliť 3D obrázky, objavila sa trojrozmerná grafika a nový smer vizualizácie – fraktálna grafika. Objavili sa osobné počítače s grafickým rozhraním pomocou počítačovej myši (Xerox Alto (1973)).

V roku 1971 matematik Henri Gouraud v roku 1972 Jim Blinn a v roku 1973 Bui Tuong Phong vyvinuté tieniace vzory, čo umožnilo grafike ísť za rovinu a presne odrážať hĺbku scény. Jim Blinn bol priekopníkom bump mappingu, techniky na modelovanie nerovných povrchov. A Phongov algoritmus sa následne stal hlavným v moderných počítačových hrách.

V roku 1972 priekopník počítačovej grafiky Edwin Catmull (Edwin Catmull) vytvoril prvé 3D vykresľovanie, drôtený a textúrovaný model vlastnej ľavej ruky.

V roku 1975 francúzsky matematik Benoit Mandelbrot (Benoit B. Mandelbrot), naprogramovanie modelu počítača IBM, na ňom postaveného obraz výsledkov výpočtu zložitého matematického vzorca (Mandelbrotova množina) a v dôsledku analýzy získaných opakujúcich sa vzorov pomenovali nádherné obrázky - fraktál(z lat. zlomkový, zlomený). Takto vznikla fraktálna geometria a nový sľubný smer v počítačovej grafike - fraktálna grafika.

Koniec 70. rokov, s príchodom osobných počítačov (4. generácia - na mikroprocesoroch) sa grafika z priemyselných systémov presunula na špecifické pracoviská a do domácností bežných používateľov. Zrodil sa priemysel videohier a počítačových hier. Prvý sériovo vyrábaný osobný počítač s farebnou grafikou bol PC. Apple II (1977) neskôr Apple Macintosh (1984)

V 80. rokoch, s vývojom videosystému osobných počítačov IBM PC (1981)), grafika sa stala detailnejšou a farebne reprodukujúcou (zvýšilo sa rozlíšenie obrazu a rozšírila sa paleta farieb). Objavili sa prvé video štandardy MDA, CGA, EGA, VGA, SVGA. Boli vyvinuté prvé štandardy pre grafické formáty súborov, napríklad GIF (1987), Grafické modelovanie vzniklo ...

Aktuálny stav[ | ]

Hlavné aplikácie[ | ]

vedecká grafika- prvé počítače slúžili len na riešenie vedeckých a priemyselných problémov. Pre lepšie pochopenie získaných výsledkov boli grafické spracovanie, zostavené grafy, schémy, výkresy vypočítaných štruktúr. Prvá grafika na stroji bola získaná v režime symbolickej tlače. Potom sa objavili špeciálne zariadenia - grafové plotre (plotre) na kreslenie kresieb a grafov atramentovým perom na papier. Moderná vedecká počítačová grafika umožňuje vykonávať výpočtové experimenty s vizuálnym znázornením ich výsledkov.

obchodná grafika- oblasť počítačovej grafiky navrhnutá tak, aby vizuálne reprezentovala rôzne ukazovatele práce inštitúcií. Plánované ukazovatele, dokumentácia výkazníctva, štatistické výkazy – to sú objekty, ku ktorým sa vytvárajú názorné materiály pomocou obchodnej grafiky. Firemný grafický softvér je súčasťou tabuliek.

Dizajnová grafika používané v práci dizajnérov, architektov, vynálezcov nových technológií. Tento typ počítačovej grafiky je nepostrádateľným prvkom CAD (systémy automatizácie dizajnu). Pomocou dizajnovej grafiky je možné získať ploché obrazy (projekcie, rezy) aj priestorové trojrozmerné obrazy.

Ilustračná grafika- ide o ľubovoľné kreslenie a kreslenie na obrazovke monitora. Ilustratívne grafické balíčky sú určené pre aplikačný softvér na všeobecné použitie. Najjednoduchšie softvérové ​​nástroje na ilustračnú grafiku sa nazývajú grafické editory.

Umelecká a reklamná grafika- stal sa populárnym najmä vďaka televízii. Pomocou počítača sa vytvárajú reklamy, karikatúry, počítačové hry, videonávody, videoprezentácie. Grafické balíky na tieto účely vyžadujú veľké počítačové zdroje z hľadiska rýchlosti a pamäte. Charakteristickou črtou týchto grafických balíkov je schopnosť vytvárať realistické obrázky a „pohyblivé obrázky“. Získavanie výkresov trojrozmerných objektov, ich rotácií, aproximácií, úberov, deformácií je spojené s veľkým množstvom výpočtov. Prenos osvetlenia objektu v závislosti od polohy svetelného zdroja, od umiestnenia tieňov, od textúry povrchu si vyžaduje výpočty, ktoré zohľadňujú zákony optiky.

Pixel art Pixel art, veľký tvar digitálne umenie, je vytvorený pomocou rastrového grafického softvéru, kde sa obrázky upravujú na úrovni pixelov. Vo zväčšenej časti obrázka sa jednotlivé pixely zobrazujú ako štvorce a sú dobre viditeľné. V digitálnych obrázkoch je pixel (alebo prvok obrázka) jeden bod v bitová mapa. Pixely sú umiestnené na pravidelnej dvojrozmernej mriežke a často sú reprezentované bodkami alebo štvorcami. Grafika vo väčšine starších (alebo relatívne obmedzených) počítačových hier a videohier, grafických hier s kalkulačkou a mnohých hier pre mobilné telefóny je väčšinou pixel art.

počítačová animácia je získavanie pohyblivých obrázkov na obrazovke. Umelec vytvára na obrazovke nákresy počiatočných a konečných pozícií pohybujúcich sa objektov, všetky medzistavy vypočítava a zobrazuje počítač, pričom vykonáva výpočty na základe matematického popisu tohto typu pohybu. Takáto animácia sa nazýva animácia kľúčových snímok. Existujú aj rôzne iné typy počítačovej animácie: procedurálna animácia, tvarová animácia, programová animácia a animácia, kde umelec sám kreslí všetky snímky „ručne“. Výsledné kresby, zobrazené postupne na obrazovke s určitou frekvenciou, vytvárajú ilúziu pohybu.

Multimédiá je kombináciou kvalitného obrazu na obrazovke počítača so zvukom. Multimediálne systémy sa najčastejšie používajú vo vzdelávaní, reklame a zábave.

Vedecká práca [ | ]

Počítačová grafika je tiež jednou z oblastí vedeckej činnosti. V oblasti počítačovej grafiky sa obhajujú dizertačné práce a konajú sa rôzne konferencie:

  • Siggraph konferencia, ktorá sa konala v USA
  • Eurographics konferencie každoročne organizuje asociácia Eurographics v Európe
  • konferencie Graphikon, ktorá sa konala v Rusku
  • CG podujatie, ktoré sa konalo v Rusku
  • CG Wave 2008, CG Wave, ktorá sa konala v Rusku

Technická stránka[ | ]

Podľa spôsobu nastavenia obrázkov možno grafiku rozdeliť do kategórií:

2D grafika[ | ]

Dvojrozmerná (2D - z angličtiny two dimensions - "dva dimenzie") počítačová grafika sa klasifikuje podľa typu prezentácie grafickej informácie a z nej vyplývajúcich algoritmov spracovania obrazu. Počítačová grafika sa zvyčajne delí na vektorovú a rastrovú, aj keď fraktálny typ znázornenia obrazu je tiež izolovaný.

Vektorová grafika[ | ]

Zároveň nie každý obrázok môže byť reprezentovaný ako súbor primitív. Táto metóda prezentácie je vhodná pre diagramy, používa sa pre škálovateľné fonty, obchodnú grafiku, je veľmi široko používaná na vytváranie karikatúr a len videí s rôznym obsahom.

Rastrová grafika[ | ]

Bitmapový príklad

fraktálna grafika[ | ]

fraktálny strom

CGI grafika [ | ]

CGI (angl. computer-generated imagery, lit. “computer-generated images”) - obrazy získané počítačom na základe výpočtu a používané vo výtvarnom umení, tlači, filmových špeciálnych efektoch, v televízii a v simulátoroch. Pohyblivé obrázky sú vytvárané počítačovou animáciou, čo je užšia oblasť CGI grafiky.

Reprezentácia farieb v počítači[ | ]

Na prenos a ukladanie farby v počítačovej grafike sa používajú rôzne formy jej znázornenia. Vo všeobecnosti je farba súborom čísel, súradníc v nejakom systéme farieb.

Štandardné spôsoby ukladania a spracovania farieb v počítači sú spôsobené vlastnosťami ľudského zraku. Najbežnejšie systémy sú RGB pre displeje a CMYK pre tlač.

Niekedy sa používa systém s viac ako tromi komponentmi. Meria sa odrazové alebo emisné spektrum zdroja, čo umožňuje presnejšie popísať fyzikálne vlastnosti farby. Takéto schémy sa používajú pri fotorealistickom 3D vykresľovaní.

Skutočná stránka grafiky[ | ]

Akýkoľvek obrázok na monitore sa vďaka svojej rovine stáva rastrom, pretože monitor je matica, pozostáva zo stĺpcov a riadkov. Trojrozmerná grafika existuje len v našej predstavivosti, keďže to, čo vidíme na monitore, je projekcia trojrozmernej postavy a priestor si vytvárame my sami. Vizualizácia grafiky teda môže byť len rastrová a vektorová a spôsob vizualizácie je len raster (súbor pixelov) a spôsob určenia obrázka závisí od počtu týchto pixelov.

Svet je trojrozmerný. Jeho obraz je dvojrozmerný. Dôležitou úlohou maľby a teraz fotografie je sprostredkovať trojrozmernosť priestoru. Rimania už nejaké techniky vlastnili, potom sa na ne zabudlo a začali sa k nim vracať klasická maľba s renesanciou.

Hlavnou technikou vytvárania trojrozmerného priestoru v maľbe je perspektíva. Železničné koľajnice, ktoré sa vzďaľujú od diváka, sú vizuálne úzke. Pri lakovaní môžu byť koľajnice fyzicky zúžené. Vo fotografii vzniká perspektíva automaticky: fotoaparát nasníma koľajnice tak úzke, ako ich oko vidí. Nenechajte ho však takmer zavrieť: už to nebude vyzerať ako perspektíva, ale ako zvláštna postava; medzi koľajnicami, bokmi ulice, brehmi rieky by sa mala zachovať výrazná medzera.

Je dôležité pochopiť, že lineárna perspektíva je najprimitívnejším a najrealistickejším spôsobom, ako vyjadriť svet. Nie náhodou sa jej vzhľad spája s divadelnými kulisami (Florenskij, Obrátená perspektíva). Konvenčnosť, jednoduchosť prenosu divadelnej scény malej hĺbky je veľmi vhodná pre fotografiu, bez rôznych techník dostupných v maľbe.

Existujú perspektívy, ktoré sú oveľa zaujímavejšie ako lineárne. V dielach čínskych majstrov existuje plávajúca perspektíva, keď sú predmety zobrazené súčasne zdola, zhora a spredu. Nebola to technická chyba nekompetentných umelcov: legendárny autor tejto techniky Guo Xi napísal, že takéto zobrazenie umožňuje realizovať svet v jeho celistvosti. Podobná je aj technika ruskej ikonomaľby, pri ktorej divák vidí tvár aj chrbát postavy súčasne. Zaujímavou technikou ikonomaľby, ktorá sa našla aj medzi západoeurópskymi umelcami, bola reverzná perspektíva, v ktorej sú vzdialené predmety, naopak, väčšie ako blízke, čím sa zdôrazňuje ich dôležitosť. Až v našich dňoch sa zistilo, že takáto perspektíva je správna: na rozdiel od vzdialených objektov je popredie skutočne vnímané v obrátenej perspektíve (Rauschenbach). Pomocou Photoshopu môžete dosiahnuť obrátenú perspektívu zväčšením objektov na pozadí. Pre diváka zvyknutého na zákonitosti fotografie bude takýto záber pôsobiť zvláštne.

Zavedenie rohu budovy do rámu, z ktorého sa steny rozchádzajú v oboch smeroch, vytvára zdanie izometrickej perspektívy. Mozog chápe, že steny sú v pravom uhle a podľa toho rozloží zvyšok obrazu. Takáto perspektíva je dynamickejšia ako čelná a prirodzenejšia pre popredie. Stačí zadať koncové rohy objektov a tesne rozmiestnených budov do rámu.

Vzhľadom na expanziu je izometrická perspektíva hlavná, čo je zriedka vhodné klasický portrét. Lineárna perspektíva, vďaka zúženiu lepšie prenáša menšie emócie.

Vo fáze snímania má fotograf k dispozícii množstvo nástrojov na zdôraznenie perspektívy. Predmety rovnakej šírky (koľaj, ulica, stĺpy, brázdy), ktoré idú do diaľky, svojim zužovaním a dokonca aj jednoduchým vzďaľovaním naznačujú divákovi trojrozmernosť priestoru. Efekt je silnejší pri snímaní z nízkeho uhla, aby sa zvýšilo skreslenie perspektívy. Na fotenie na šírku to stačí, no pri malej hĺbke záberu pri fotení interiéru je efekt takmer nepostrehnuteľný. Dá sa to trochu vylepšiť v postprocese zúžením hornej časti obrázka (Transform Perspective). Aj v krajine však môže hypertrofovaná perspektíva vyzerať zaujímavo.

Hĺbka môže byť explicitná v zmysle obrázku: budovy sú oddelené ulicou alebo riekou. Uhlopriečka zdôrazňuje trojrozmernosť; ako most cez rieku.

Objekty veľkosti známej divákovi v pozadí nastavujú mierku a podľa toho tvoria perspektívu. Pri krajinárskej fotografii môže byť takýmto objektom auto, no pri portrétnej fotografii skúste nohu zohnúť a zasunúť (preč od fotoaparátu) pod stoličku tak, aby sa vám, hoci zostala viditeľná, zdala menšia. V postprocese môžete túto nohu dokonca mierne zmenšiť.

Ornament sprostredkúva perspektívu vizuálnym zmenšením prvkov. Príkladom môžu byť veľké dlaždice na podlahe, označujúce čiary na ceste.

Existuje technika hypertrofovaného popredia. Neúmerne veľký vytvára hĺbku obrazu. Porovnaním mierky popredia a modelu oko dospeje k záveru, že model je oveľa ďalej, ako sa zdá. Hypertrofia by mala zostať jemná, aby obraz nebol vnímaný ako chyba. Táto technika je vhodná nielen pre post-processing, ale aj pre fotografovanie: deformujte proporcie pri fotografovaní s 35 alebo 50 mm objektívom. Snímanie širokouhlým objektívom rozťahuje priestor a zvyšuje jeho trojrozmernosť v dôsledku narušenia proporcií. Efekt je silnejší, ak model nasnímate z blízka, ale pozor na groteskné proporcie: iba autori náboženských obrázkov dokážu zobraziť osobu väčšiu ako budova.

Crossover funguje skvele. Ak jablko čiastočne zakrýva hrušku, mozog sa nebude mýliť: jablko je pred hruškou. Model, ktorý čiastočne prekrýva nábytok, tak vytvára hĺbku interiéru.

Hĺbku obrazu dodáva aj striedanie svetlých a tmavých škvŕn. Mozog zo skúsenosti vie, že blízke objekty sú približne rovnako osvetlené, takže rôzne osvetlené objekty interpretuje tak, že sa nachádzajú v rôznych vzdialenostiach. Pre tento efekt sa škvrny striedajú v smere osi perspektívy – hlboko do obrazu, nie cez neho. Napríklad, keď fotografujete modelku ležiacu mimo fotoaparátu v tmavom ráme, zvýraznite svetlo v blízkosti zadku a nôh. V postprocese môžete zosvetliť/stmaviť oblasti.

Postupnosť čoraz tmavších objektov sa vníma ako klesajúci. Postupným tieňovaním objektov pozdĺž aktívnej línie môžete získať jemný zmysel pre perspektívu. Podobne je hĺbka prenášaná tlmiacim svetlom: prejdite pruhom svetla po nábytku alebo na podlahe.

Trojrozmerný obraz je možné získať nielen vďaka svetlu, ale aj farebnému kontrastu. Túto techniku ​​poznali flámski maliari, ktorí si na svoje zátišia umiestňovali svetlé farebné škvrny. Červené granátové jablko a žltý citrón vedľa seba budú vyzerať trojrozmerne aj pri plochom čelnom osvetlení. Obzvlášť dobre vyniknú na pozadí fialového hrozna: teplá farba na studenom pozadí. Svetlé farebné plochy sa dobre vymykajú z tmy aj pri slabom svetle typickom pre zátišie. Farebný kontrast funguje lepšie so základnými farbami, červenou, žltou, modrou, než s odtieňmi.

Na čiernom pozadí žltá vystupuje dopredu, modrá sa schováva späť. Na bielom pozadí - naopak. Sýtosť farieb tento efekt zosilňuje. Prečo sa to deje? Žltá farba nie je nikdy tmavá, takže mozog odmieta uveriť, že žltý predmet môže byť ponorený do tmavého pozadia, nie osvetlený. Modrá je naopak tmavá.

Zlepšenie perspektívy v postprocese spočíva v simulácii vnímania atmosféry: vzdialené objekty sa nám zdajú svetlejšie, rozmazané, so zníženým kontrastom jasu, sýtosti a tónu.

Okrem veľkých vzdialeností, atmosférické efekty prirodzene vyzerajú v rannom opare, hmle, zadymenom bare. Zvážte počasie: za zamračeného dňa alebo za súmraku nemôže byť medzi popredím a pozadím žiadny významný rozdiel.

Najsilnejším z faktorov je kontrast v jase. V nastaveniach ide o obvyklý kontrast. Znížte kontrast vzdialených objektov, zvýšte kontrast popredia – a obraz bude výrazný. Tu nejde o kontrast medzi popredím a pozadím, ale o kontrast pozadia, ktorý by mal byť nižší ako kontrast popredia. Táto metóda je vhodná nielen pri fotografovaní krajiny a žánrov, ale aj pri štúdiových portrétoch: zvýšte kontrast prednej časti tváre, znížte kontrast na vlasoch a lícnych kostiach, oblečení. Portrétne filtre robia niečo podobné, rozmazávajú pokožku objektu a oči a pery zostávajú ostré.

Úprava kontrastu je najjednoduchší spôsob 3D následného spracovania obrazu. Na rozdiel od iných procesov si divák zmeny takmer nevšimne, čím sa zachová maximálna prirodzenosť.

Rozmazanie je podobné ako zníženie kontrastu, ale ide o odlišné procesy. Obraz môže mať nízky kontrast, pričom zostáva ostrý. Kvôli obmedzenej hĺbke ostrosti zostáva rozmazanie vzdialených objektov najobľúbenejším spôsobom sprostredkovania trojrozmernosti vo fotografii a je ľahké ho vylepšiť rozmazaním pozadia v postprocese. Menej detailov by preto malo byť umiestnené v pozadí – mozog neočakáva odlíšiteľné objekty v diaľke. Pritom zníženie kontrastu lepšie zodpovedá prirodzenému vnímaniu: vzdialené hory sú vnímané ako málo kontrastné, nie rozmazané, pretože pri skenovaní krajiny oko neustále preostruje, problém hĺbky ostrosti je mu cudzí. Rozmazaním pozadia môžete zároveň doostriť popredie. Navyše v popredí môžete vylepšiť čiary obrazu (High Pass Filter alebo Clarity). Práve vysoká ostrosť popredia vysvetľuje charakteristické vydutie obrazu kvalitných objektívov. Pozor: z dôvodu mierneho zvýšenia trojrozmernosti môžete obrázok príliš stvrdnúť.

Ľahšie predmety sa zdajú byť vzdialenejšie. Je to spôsobené tým, že v prírode vidíme vzdialené predmety cez hrúbku vzduchu rozptyľujúceho svetlo; vzdialené hory sa zdajú svetlé. Pri krajinárskej fotografii si preto treba dávať pozor na polohu svetlých objektov v popredí.

Zosvetlite vzdialené predmety. Čím ďalej, tým viac splývajú s jasom a tónom oblohy. Upozorňujeme, že horizontálne objekty (pevnina, more) sú lepšie osvetlené ako vertikálne (steny, stromy), takže to so zosvetlením druhých nepreháňajte. V každom prípade by objekty mali zostať zreteľne menej jasné ako obloha.


No, ak si všimnete, že zosvetlenie je ďalší spôsob, ako znížiť kontrast v jase pozadia. Trochu stmavte popredie, aby ste zvýšili efekt vydutia.

Zdalo by sa, že v interiéri je opak pravdou. Ak je na ulici oko zvyknuté na to, že vzdialenosť je svetlo, potom v miestnosti je svetlo často zamerané na osobu a interiér je ponorený do tmy; mozog je zvyknutý na osvetlenie v popredí, nie v pozadí. Na snímkach interiéru s malou hĺbkou scény, na rozdiel od snímok krajiny, osvetlený model vyčnieva z tmavého pozadia. Je tu však aj opačný faktor: 99 % svojho vývoja človek pozoroval perspektívu na otvorenom priestranstve a s príchodom miestností mozog ešte nemal čas na reorganizáciu. Vermeer preferoval svetlé pozadie na portréty a tie sú naozaj vypuklé. Osvetlenie vertikálneho pozadia, odporúčané vo fotografii, nielenže oddeľuje model od neho, ale zosvetlením pozadia dodáva obrázku miernu trojrozmernosť. Tu sa stretávame s tým, že mozog analyzuje umiestnenie predmetov podľa viacerých faktorov a tie môžu byť v konflikte.

Zaujímavo vyzerá štúdiové osvetlenie, v ktorom svetelné body ležia na oblastiach modelu vzdialených od fotoaparátu. Zvýrazní sa napríklad hrudník, ktorý je ďalej od fotoaparátu.

Znížte sýtosť farieb na vzdialených objektoch: vďaka hrúbke vzduchu, ktorý nás oddeľuje, sú vzdialené hory desaturované takmer na úroveň monochrómu a pokryté modrým oparom. Sýtosť popredia možno zvýšiť.

Keďže žltá je svetlá a modrá a červená sú tmavé, farebný kontrast je tiež kontrastom jasu.

Desaturujete vzdialené pozadie, nenechajte ho zmiznúť z dohľadu. Často, naopak, musíte zvýšiť sýtosť pozadia, aby ste ho dostali von. To je dôležitejšie ako trojrozmernosť.

Veľa tipov pre 3D fotografiu sa týka teplotného kontrastu. V skutočnosti je tento efekt veľmi slabý, ľahko ho preruší kontrast v jase. Navyše teplotný kontrast je nepríjemný, markantný.

Veľmi vzdialené predmety vyzerajú chladnejšie, pretože teplé oranžové svetlo je absorbované vzduchom. Pri fotografovaní modelky na pláži s loďami na horizonte v pozadí znížte v postprocese teplotu farieb vzdialeného mora a lodí. Z modrého mora sa vynára modelka v červených plavkách a z modrastého súmraku modelka v žltom svetle pouličnej lampy.

Toto je samostatné tónovanie: robíme model teplejší, pozadie - chladnejšie. Mozog chápe, že v tej istej rovine nie sú rôzne teploty farieb a vníma takýto obraz ako trojrozmerný, v ktorom model vyčnieva z pozadia. Oddelené tónovanie dodáva krajinám hĺbku: urobte popredie teplejšie, pozadie chladnejšie.

Dôležitá výnimka z rozdeleného tónovania: pri východe a západe slnka nie je vzdialené pozadie vôbec studené, ale teplé, so žltými a červeno-oranžovými tónmi. Samozrejmé riešenie - použiť biely model vo fialových plavkách - nefunguje, pretože svetlo západu slnka dáva teplý odtieň aj na telo modelky.

Aby sme to zhrnuli, aby bola fotografia trojrozmerná na základe atmosférických efektov, je potrebné kontrastovať popredie a pozadie. Hlavná opozícia je v obvyklom kontraste: popredie je kontrastné, pozadie je málo kontrastné. Druhá opozícia je v ostrosti: popredie je ostré, pozadie je rozmazané. Tretia opozícia je podľa svetlosti: popredie je tmavé, pozadie svetlé. Štvrtou opozíciou je sýtosť: farby popredia sú nasýtené, farby pozadia sú desaturované. Piata opozícia je v teplote: popredie je teplé, pozadie studené.

Tieto faktory sú často viacsmerné. Žltá je jasnejšia ako modrá a svetlé objekty sa javia ďalej ako tmavé. Bolo by prirodzené očakávať, že žltá ustúpi a modrá sa priblíži k divákovi. V skutočnosti je opak pravdou: zo studeného pozadia vystupuje teplá farba. To znamená, že farba sa ukazuje ako silnejší faktor ako jas. Čo pri zamyslení nie je prekvapujúce: žltá a červená sú jasne rozlíšiteľné len z blízka a divák neočakáva, že ich stretne na veľkú vzdialenosť.

Zrátané a podčiarknuté: udržujte pozadie nízko kontrastné, vyblednuté, svetlé, desaturované, modrasté. A pripravte sa na to, že divákovi, ktorý je zvyknutý na hypertrofované 3D filmy, bude vami vytvorená trojrozmernosť sotva viditeľná alebo chýba.

AT portrétna fotografia, je lepšie staviť na osvedčený šerosvitný efekt - hru šerosvitu na tvári modelky, vďaka ktorej bude obraz poriadne vypuklý. V žánrovej fotografii poskytuje perspektíva najvýraznejší trojrozmerný efekt. V zátiší bude hlavným faktorom priesečník (prekrytie) objektov.

Nenechajte sa uniesť perspektívou; je to len pozadie pre čelnú rovinu, na ktorej sa váš obraz chveje. AT moderná maľba, ďaleko od realizmu, perspektíva nie je vysoko cenená.

Stiahnite si celú knihu:

3D a 2D obrazy: Modely, algoritmy a oblasti analýzy

P.A. Chochia

Abstrakt - Zvažuje sa problematika modifikácie dvojrozmerného modelu a algoritmov spracovania pri prechode z dvojrozmerných na trojrozmerné obrázky. Zobrazia sa zmeny v oblasti analýzy, algoritmy filtrovania, rozklad obrazu a detekcia objektov. Navrhujú sa rýchle algoritmy na výpočet miestneho priemeru a štatistiky objednávok cez posuvné okno pre 3D obrázky.

Kľúčové slová - Spracovanie obrazu, 3D obraz, obrazový model, algoritmus spracovania, oblasť analýzy, rýchle algoritmy.

I. úvod

Keď sa použije termín „trojrozmerný obraz“, často rozumejú úplne iným typom údajov – hlavné sú nasledovné.

1. Dáta dané funkciou troch súradníc a sú homeomorfnou reprezentáciou určitej trojrozmernej oblasti trojrozmerného priestoru vrátane všetkých objektov v nej obsiahnutých.

2. Stereoskopický obraz pozostávajúci z dvojice dvojrozmerných obrazov, ktoré v dôsledku rozdielov dávajú pozorovateľovi predstavu o umiestnení objektov.

3. Obraz, ktorý je projekciou trojrozmernej scény (napríklad axonometrickej), ktorá umožňuje hodnotiť tvar a umiestnenie predmetov, no zároveň zostáva dvojrozmerná.

4. Dvojrozmerný obraz, ktorého každý bod zodpovedá niektorým súradniciam v trojrozmernom priestore, ako je rozsah alebo terén.

5. Obrazy vytvorené špeciálnym spôsobom, ktoré vytvárajú obrazy predmetov, ako sú hologramy.

6. Video sekvencie obsahujúce súbor snímok objektov. Takéto údaje môžu byť reprezentované ako trojrozmerné pole, ale jedna zo súradníc v tomto prípade nie je priestorová, ale časová.

Ďalej pod trojrozmerným alebo 3D obrazom (spojitým alebo diskrétnym) sa budú rozumieť len obrazy prvého typu. 3D obraz je v podstate rozšírením bežného 2D obrazu pridaním ďalšieho priestorového rozmeru.

Spôsoby vytvárania trojrozmerného obrazu môžu byť rôzne; najznámejší je

P.A. Chochia, Ph.D., vedúci výskumník, Inštitút pre problémy prenosu informácií Ruskej akadémie vied, Moskva. (e-mail: [chránený e-mailom])).

tomografické skenovanie - röntgenová počítačová tomografia alebo magnetická rezonancia. 3D obraz je možné získať ako výsledok seizmického prieskumu pri geologických prieskumoch, pri mikroskopovaní pomocou zoom objektívu, pri počítačovej simulácii trojrozmerných objektov a scén alebo iným spôsobom.

Spracovanie a analýza trojrozmerných obrazov zohráva v súčasnosti významnú úlohu v mnohých oblastiach výskumu, najmä v medicíne a geológii. V tomto príspevku sa zaoberáme problematikou rozšírenia dvojrozmerného obrazového modelu a jeho aplikovaním na trojrozmerné obrazy, problematikou modifikácie operácií frekvenčnej a priestorovej filtrácie pri prechode do 3D, problematikou vyhladzovania a rozkladu obrazov. , filtrovanie šumu, detekcia kontúr a objektov, ako aj výpočtové aspekty implementácie niektorých algoritmov pre 3D obrazy.

Väčšina filtračných algoritmov pri prechode z dvojrozmerných na trojrozmerné signály sa dá relatívne ľahko modifikovať. Ukážu to príklady najbežnejších algoritmov založených na frekvenčnom a priestorovom filtrovaní.

II. Vlastnosti trojrozmerného obrazu V diskrétnej forme je 3D obraz reprezentovaný poľom veľkosti X = MxNxK. Rovnako ako v 2D, hodnota každého prvku xmnk je hodnota logaritmu jasu (energie) kvantovaná do (xmax+1) gradácií 0< xmnk < xmax, которое для краткости будем называть просто яркостью. Дискретный элемент 3D-изображения принято называть вексель. Трехмерное изображение, отображающее некоторую сцену, можно рассматривать состоящим из плотно упакованных связных трехмерных областей (объектов), соответствующих деталям сцены. Областью или объектом будем называть максимальное по размеру связное множество элементов изображения, имеющих близкие, возможно плавно меняющиеся значения яркости. Области могут соприкасаться произвольным образом, в том числе одна область может быть полностью окружена другой. На границах соседних областей значения яркости должны заметно различаться. Не соприкасающиеся области могут иметь произвольные, в том числе и совпадающие яркости. Пространственные границы между соседними областями, как объектами различающейся яркости, называют контурами. 3D-изображения характеризуются

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

nasledujúce vlastnosti:

3D obraz - súbor objektov husto vypĺňajúcich priestor obrazu;

Obrysy v 3D obraze sú priestorové hranice medzi objektmi;

Rozrezanie 3D obrazu rovinou a jeho premietnutie do roviny ľubovoľného smeru poskytuje dvojrozmerný signál so všetkými vlastnosťami bežného 2D obrazu.

III. Oblasti analýzy

Oblasť analýzy je podmnožina vstupných údajov používaných pri odhade parametrov. Metódy, v ktorých každý bod (alebo malé fragmenty) obrazu používa svoje vlastné parametre spracovania, určené obmedzenou a spravidla analytickou oblasťou sústredenou v danom bode, sa nazývajú lokálne.

Uvažujme spojenú množinu prvkov xijle Vd(xmnk) tak, že vzdialenosť od centrálneho prvku xmnk nie je väčšia ako d a spolu tvoria obrazec určitého tvaru. Pre d< 2a3 множество Vd(xmnk), окружающее центральный элемент (воксель) xmnk, будем называть окрестностью и обозначать Vmnk, а при d >>1 - fragment a označujú Wmnk. Všimnite si, že v závislosti od vykonaných operácií samotný centrálny prvok xmnk môže alebo nemusí patriť do Vd(x). V súlade s tým operácie formulára

ymnk = f(xijl 1 xijl e Vd(xmnk) ), (1)

v ktorých výsledok v každom bode (m,n,k) závisí iba od hodnôt prvkov xijl zahrnutých vo Vd(xmnk), sa nazývajú lokálne operácie.

Pri prechode z 2D do 3D prechádzajú varianty symetrických susedstiev a susedstiev prvkov nasledujúcimi zmenami. Okolie 2x2 prvkov (4 pixely) sa stáva susedstvom 2x2x2 prvkov (8 voxelov), pričom každý voxel susedí s každým. V dvojrozmernom susedstve prvkov 3x3 (9 pixelov), ako je známe, možno uvažovať o dvoch susedstvách prvkov: 4 susedstve (iba po stranách pixelov) a 8 susedstve (po stranách a vrcholoch pixelov) . Analógom prvého z nich v 3D bude susedstvo so 6 susedstvom voxelov (obr. 1a). Analógom druhého je susedstvo s 26 susedmi voxelov (obr. 1c). Možný je medziľahlý variant s 18 susedstvom voxelov (obr. 1b). Voľba variantu okolia je zvyčajne určená kontextom problému a použitým algoritmom.

Ryža. 1. Okolie a susedstvá voxelov v 3D: a) 6-okolie; b) 18-susedstvo; c) 26-okolie.

V niektorých prípadoch nás nezaujíma celá množina bodov, ktoré spadajú do oblasti analýzy, ale iba niektoré jej podmnožiny vrátane centrálneho prvku, ktorý nazveme oblasť členstva. Spôsob, akým sa zvolí členská oblasť, závisí od

úlohy; niektoré možnosti sú uvedené v časti VI.

IV. Dvojrozmerný viaczložkový model

3D OBRAZ

Na formulovanie informácií o hlavných vlastnostiach obrázkov – topologických (tvary, veľkosti plôch a vrstevnicové rozdiely medzi nimi) a štatistických (vzťahy medzi hodnotami prvkov) je potrebný vhodný model obrázka. Aby bola užitočná, mala by opísať vlastnosti obrazov vo vzdialenostiach určených charakteristikami problémov, ako aj poskytnúť príležitosti na zostavenie účinných algoritmov na spracovanie a analýzu obrazov.

Štatistické vzťahy prvkov obrazu umiestnených vo veľkých vzdialenostiach sa výrazne líšia od podobných vlastností blízkych prvkov a nemožno ich opísať rovnakými pomermi. Pre konvenčný dvojrozmerný obraz bol vyvinutý dvojrozmerný viaczložkový model, ktorý pomerne dobre popisuje vzťah prvkov pri malých vzdialenostiach niekoľkých krokov vzorkovania, ako aj pri veľkých vzdialenostiach zodpovedajúcich veľkosti objektov obrazu. Dá sa úspešne preniesť do 3D obrázkov.

Hodnoty prvkov 3D obrazu X = budú prezentované ako súčet štatisticky nezávislých komponentov:

xmnk Smnk ^tmnk + ^mnk (2)

Prvý člen súčtu je po častiach hladký komponent Smnk, ktorý určuje úrovne jasu rozšírených oblastí obrazu; tmnk - textúra-detailný komponent, ktorý nesie informácie o textúre a malé detaily; £,mnk - zložka šumu, určená šumom rekordéra, analógovo-digitálneho prevodníka atď. Všetky komponenty sa predpokladajú

nezávislé a aditívne, zatiaľ čo tmnk a £,mnk sú normálne rozdelené a nezaujaté.

A. Malá mierka veľkosti

Na mierke malej veľkosti (mierka susedných prvkov) sa uvažuje relatívne malá spojená množina prvkov umiestnených vo vzdialenosti niekoľkých diskretizačných krokov. Rovnako ako v dvojrozmernom modeli sú prvky trojrozmerného obrazu rozdelené do dvoch nepretínajúcich sa množín: tie, ktoré spadajú na hraničné rezy (obrys) a tie, ktoré nespadajú (vnútorné), ktoré spolu celý obrázok. Okolie Vmnk prvku xmnk sa považuje za skupinu prvkov R xrmnk e Vmnk, r = 1,...,R, najbližšie k xmnk a spadajúcich do rovnakej množiny (obrysovej alebo vnútornej) ako prvok xmnk (obr. 2).

Pomocou metódy najmenších štvorcov sa nakreslí nadrovina, ktorá je najbližšie k hodnotám prvkov z Vmnk, komponent s nadrovinou orientovanou pozdĺž súradnicových osí MNK, ktorej určitý uhol, veľkosť a smer v bode (m,n ,k) je charakterizovaný vektorom gmnk. V bode r okolia sa nakreslená nadrovina líši od hodnoty

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

xrmnk s náhodnou hodnotou yrmnk . Takáto reprezentácia

umožňuje prepojiť hodnoty prvkov okolia

Vzorec XLk ^ Vmnk:

Xmnk ^mnk + P gmnk + Y mnk , (3)

kde pmnk je hodnota nakreslenej nadroviny v stredovom bode okolia (m,n,k), pr je vzdialenosť medzi centrálnym prvkom Xmnk a xrmnk, grmnk je hodnota priemetu gmnk na vektor z Xmnk na xrmnk a yrmnk je

náhodná hodnota.

Zavádza sa pojem masky obrysu E =: emnk = 1 pre obrys a emnk = 0 pre vnútorné prvky. Označenie pre obrysové a vnútorné prvky grmnk

cez Vmnk a Vmnk a Ymnk cez Cmnk a hmnk

reprezentujú grmnk a jrmnk ako súčty

grmnk = emnk

a Ymnk emnk Zmnk +(1 emnk)nmnk "B

Výsledkom je, že získame vzorec pre model trojrozmerného okolia:

Xmnk ^ mnk ~ + emnk (f mnk pr + C "mnkMKnWmnkpr Wmk) (4)

Tu Zmnk je stochastick excitcia v bode r

susedstva pre vrstevnice a nrmnk pre interiery

prvkov. Predpokladá sa, že náhodné premenné φ, ^, Wmnk, Zmnk a Pmnk sú nekorelované a nezaujaté a zložky šumu Zmnk a pmnk sú normálne rozdelené. Vykonané experimenty ukazujú, že hodnoty disperzií zložiek f a f sa líšia 10-100 krát.

B. Veľká mierka veľkosti

Vo veľkom meradle (mierka fragmentových objektov) sa predpokladá, že hladké komponenty Sv tých častí oblastí uv (v = 1,...,V), ktoré spadajú do fragmentu Wmnk, sú dané polynómom. stupeň nie vyšší ako u. Potom možno Sii vo vnútri fragmentu Wmnk opísať vzorcom:

V yu ju-p ju-p-q

Sj (Wmnk) = Ё §Bv Ё Ё Ё аР^Р ^ (5)

tu (i,j,l) je bod oblasti u vo fragmente Wmnk; 5 v = 1, ak bod (i,j,l) e u a 5 v = 0 inak

prípady. Pridaním komponentov textúry tj a noise ^ do (5) získame výraz pre hodnotu prvkov vo vnútri fragmentu:

^ = Ё 5uv ЁЁ Ё ^РЛГ + j + ^

v=1 y p=0 q=0 r=0 J

Toto je všeobecný vzorec modelu, ktorý popisuje hodnoty prvkov oblastí v rámci fragmentu. tj komponenty

a považujú sa za normálne distribuované, ale

hodnoty rozptylov tv sa vo všeobecnosti líšia v závislosti od regiónu. Dvojrozmerná verzia obrázka obsahujúca niekoľko oblastí, ako aj okolie a fragment okolo prvku Xmnk, sú znázornené na obr. 2. Pre 3D obraz bude okolie s fragmentom aj samotné regióny trojrozmernými obrazcami.

Na mnohých reálnych obrazoch oblasti, v

v rámci typického analytického fragmentu majú približne konštantné jasy, ktoré sa výrazne nemenia. Preto je v mnohých prípadoch prípustné zvoliť minimálny stupeň polynómu: u = 0. Potom

Sj (Wmnk) = Svmnk a (6) sa zjednodušuje na nasledujúci tvar:

ёb (S "mnk + t, + C).

Toto je vzorec pre model po častiach konštantný fragment na reprezentáciu častí oblastí obrazu, ktoré spadajú do fragmentu Wmnk.

Vo veľkom meradle sa zvyčajne predpokladá, že fragment Wmnk je kváder; je to kvôli zvláštnostiam algoritmickej implementácie metód na spracovanie trojrozmerných obrazov.

Ryža. 2. Nakreslite obrázok; spracovaný prvok je obklopený hranicami susedstva a fragmentov.

V. Zmena frekvenčných algoritmov v 3D

Jedným z efektívnych prístupov k spracovaniu signálov je použitie filtračných metód, ktoré využívajú ortogonálne transformácie: Fourier, Walsh-Hadamard, kosínus a iné. Najbežnejšia trieda transformácií, ktoré poskytujú rozšírenie signálov z hľadiska harmonických funkcií, z ktorých najdôležitejšia je Fourierova transformácia; na jeho príklade a ukážte modifikáciu transformácie.

Pri prechode z 2D na 3D obrazy sa priestorová aj frekvenčná doména reprezentácie údajov stávajú trojrozmernými, t.j. namiesto dvojrozmernej dostaneme trojrozmernú Fourierovu transformáciu; hlavné vlastnosti Fourierovej transformácie sú zachované.

Nech f(x,y,z) je spojitá funkcia troch

premenné x, y a z. Dvojica trojrozmerných spojitých Fourierových transformácií (dopredná a inverzná) je daná nasledujúcimi výrazmi:

F(u, v, w) = J J J f (x, y, z)e-i2n(xu+yv+zw)dxdydz (8)

a f (x,y,z) = J J J F(u,v,w)ei2n(xu+yv+zw)dudvdw, (9)

kde u, v a w sú spojité frekvenčné premenné a x, y a z sú spojité priestorové premenné.

3D diskrétna Fourierova transformácia (DFT)

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

možno napísať ako:

F(u,v, w) = XXS f(m,n,k)e-nM3m,M+vn/N+wk/K>, (10)

kde f(m,n,k) je trojrozmerné pole s rozmermi MxNxK. Inverzná trojrozmerná diskrétna Fourierova transformácia bude mať tvar:

f(m,n,k) = -L_Y Y Y F(u,v,w) e2n(um/M+vn/N+wk/K) (11)

za 0< m < M, 0 < n < N и 0 < k < K, а также 0 < u < M, 0 < v < N и 0 < w < K.

Rovnako ako v dvojrozmernom prípade sa frekvenčné filtrovanie trojrozmerného signálu vykonáva vykonaním priamej Fourierovej transformácie (10), úpravou výsledného spektra F(u, v, w) a potom inverznou transformáciou (11). . Analogicky s Fourierovou transformáciou, ostatné ortogonálne transformácie, keď prechádzajú na trojrozmerný signál, sú tiež ľahko modifikované pridaním dimenzie.

VI. Zmenu priestorových algoritmov v 3D Priestorové filtrovanie zvyčajne vykonávajú miestni operátori podľa vzorca (1) s určitými obmedzeniami veľkosti lokálnej oblasti analýzy Vd(x), keďže v prípade funkcie f(v) v (1) všeobecného tvaru sa množstvo potrebných výpočtov zvyšuje aspoň úmerne počtu prvkov, ktoré spadajú do Vd(x). Okolie, ktoré v 2D prípade obsahujú približne (2d)2 pixely, v 3D už budú obsahovať približne (2d)3 voxely. Napriek tomu pre niektoré transformácie v trojrozmernom prípade, ako aj v dvojrozmernom prípade, je možné zostaviť rýchle algoritmy.

A. Algoritmy využívajúce odhad strednej hodnoty fragmentov

Množstvo algoritmov na spracovanie dvojrozmerných obrazov súvisiacich s vyhladzovaním, zvýrazňovaním nízkofrekvenčných alebo vysokofrekvenčných komponentov a vylepšovaním obrazu je zhrnutých do nasledujúceho vzorca:

ymn f(xmn Smn,Dmn) + bSmn + c,

kde xmn je hodnota centrálneho prvku, Smn je odhad vyhladenej hodnoty pre bod (m,n) (napríklad hodnota aritmetického priemeru alebo mediánu v rámci fragmentu), Dmn je odhad rozptylu nad fragmentom, f(u,v) je závislosť vylepšenia kontrastu, b a c sú možnosti prevodu. Teda pre f(u,v) = 0 a c = 0 získame výber nízkofrekvenčnej zložky (vyhladzovanie), pre f(u,v) = u, b = 0 a c = 0,5 výber vysokofrekvenčnej zložky a pre f (u, v) > u, b< 1 и c ~ (1-b)/2 - улучшение изображения ,.

Transformácie tvaru (12) je možné jednoducho preniesť do 3D obrázkov pridaním dimenzie, ale berúc do úvahy skutočnosť, že Smnk, ako aj u a v vo f(u,v) by už nemali byť určené dvojrozmerným , ale trojrozmerným fragmentom (obdĺžnikový hranol) so stredom v bode (m,n,k):

ymnk f(xmnk Smnk,Dmnk) + bSmnk + c. (13)

Úpravy algoritmov pre rýchly výpočet aritmetického priemeru alebo mediánu Smnk, ako aj

Disperzie Dmnk sú zvažované na konci článku.

B. Operátory poklesu obrysu Väčšina algoritmov na detekciu hrán v obraze je založená na operátoroch poklesu hrán, ktoré používajú odhady hodnôt buď prvej alebo druhej derivácie. V prípade 2D obrázkov sú obrysy objektu čiary, ktoré oddeľujú ploché oblasti; v prípade, že čiary nemajú prestávky, získame vrstevnicovú mapu zobrazenej scény.

V trojrozmernom priestore je obrysový obraz súborom ľubovoľne tvarovaných plôch oddeľujúcich objekty a tu sa môžu vyskytnúť rôzne konfigurácie obrysov, napríklad sa stanú platnými samopriesečníky a uzly. Úsek 3D obrysového obrazu rovinou je 2D obrysová mapa. Takáto mapa sa však nemusí zhodovať s mapou získanou nakreslením obrysov na 2D obrázku, ktorý je rezom 3D obrázku v tej istej rovine.

Uvažujme o modifikáciách základných operátorov prepadov kontúr na základe prvej a druhej derivácie pri prechode z 2D na 3D obrazy v rámci vyššie uvažovaných trojrozmerných susedstiev.

1) Na základe prvej derivácie: Robertsov operátor Robertsov operátor pre dvojrozmerný obrázok je formulovaný ako súčet absolútnych hodnôt rozdielov hodnôt diagonálnych prvkov na štvorci 2x2 pixelov: y (m,n)=(lx(m,n)-x(m+l,n+1)l+lx(m+l,n)-x(m,n+l)l)/2. (štrnásť)

Pre trojrozmerný obrázok možno Robertsov operátor reprezentovať ako súčet absolútnych rozdielov prvkov v uhlopriečkach kocky 2x2x2 pixelov: y(m,n,k) = (15)

=(lx(m,n,k)-x(m+ 1,n+1,k+1)l+ lx(m+ 1,n,k)-x(m,n+ 1,k+1)l+ +lx( m,n+1,k)-x(m+1,n,k+1)l+lx(m,n,k+1)-x(m+1,n+1,k)l)/4 .

2) Na základe prvej derivácie: Sobelov operátor Pre dvojrozmerný obraz je Sobelov operátor daný:

y(m,n) = (lx(m-1,n-1)+2x(m-1,n)+x(m-1,n+1) -

X(m+1,n-1)-2x(m+1,n)-x(m+1,n+1)l +

Lx(m-1,n-1)+2x(m,n-1)+x(m+1,n-1) - (16)

X(m+l,n-l)-2x(m+l,n)-x(m+l,n+l)l)/8.

Na zostavenie Sobelovho operátora (a podobne

him) pre 3D obraz najprv definujeme čiastkové odozvy ako moduly rozdielov v hodnotách prvkov pre každý zo smerov m, n a k, čo zodpovedá výrazu pod jedným zo znakov modul v (16). Pre smer m možno takúto závislosť ym(m,n,k) až po koeficienty a, b a c vyjadriť vzorcom:

Lax(m- 1,n- 1,k-1)+bx(m- 1,n- 1,k)+ax(m-1,n-1,k+1)+

Bx(m-1,n,k-1) +cx(m-1,n,k) +bx(m-1,n,k+1)+

Ax(m- 1,n+ 1,k-1)+bx(m- 1,n+ 1,k)+ax(m-1,n+1,k+1)-

Ax(m+ 1,n-1,k-1)-bx(m+ 1,n-1,k)-ax(m+1,n-1,k+1)-

Bx(m+1,n,k-1) -cx(m+1,n,k) -bx(m+1,n,k+1)-

Ax(m+ 1,n+1,k-1)-bx(m+ 1,n+1,k)-ax(m+1,n+1,k+1)l/

/(4a+4b+c). (17)

Moduly rozdielov yn(m,n,k) a yk(m,n,k) pre zložky n a k sa zapisujú podobným spôsobom.

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

Trojrozmerný operátor podobný Sobelovmu operátoru možno vyjadriť ako základný súčet druhých mocnín odpovedí v troch smeroch:

y(m,n,k)= (2+ 2+2)1/2. (18) Koeficienty a, b a c sa odporúčajú zvoliť ako 1, 2 a 3 v tomto poradí.

3) Na základe druhej derivácie: Laplaceov operátor Laplaceov operátor (Laplacián) pre dvojrozmerné

obrázok je daný nasledujúcim vzorcom: y(m,n) =

(x(m-1,n-1)+x(m-1,n)+x(m-1,n+1)+x(m,n-1)+x(m,n+1) + +x(m+l,n-l)+x(m+l,n)+x(m+l,n+l))/8 - x(m,n). (devätnásť)

Pre 3D obraz môže byť modifikácia Laplaciána vyjadrená ako súbor susedných prvkov:

kde Vmnk je okolie bodu xmnk bez samotného centrálneho bodu xmnk, QV je počet bodov v takomto okolí, (x^) je množina prvkov okolia Vmnk. Vmnk môže byť jedným zo susedstiev znázornených na obr. 1; pre okolie (a) QV = 6, pre (b) Qv = 18, pre (c) Qv = 26.

4) Iné obrysové operátory

Pokiaľ ide o dvojrozmerný prípad, je možné zostaviť aj ďalšie detektory, ktoré umožňujú detekovať poklesy obrysu, napríklad rozdiel medzi maximálnymi a minimálnymi hodnotami prvkov okolia Vmnk:

ymnk = max (xijl I xijl e Vmnk) - min( xtji I xj e Vmnk).

C. Filtrovanie impulzného šumu Impulzný šum je pomerne zriedkavé skreslenie jednotlivých prvkov obrazu, kedy sa hodnoty šumu výrazne líšia od skutočných hodnôt signálu a nie sú s nimi korelované. Model skreslenia obrazu impulzným šumom je jednoduchý. Hodnota každého z prvkov xmnk sa nahradí náhodnou hodnotou 4mnk s pravdepodobnosťou p, bez ohľadu na hodnoty ostatných prvkov. Označme X' = pôvodný neskreslený obraz, X = - skreslený impulzným šumom a Y = - výsledok filtrovania. Proces skreslenia bude prezentovaný vo forme:

Г xm nk s pravdepodobnosťou (1 - p);

s pravdepodobnosťou p.

Spravidla sa predpokladá, že hodnoty impulzného šumu 4mnk sú rovnomerne rozdelené v rozsahu jasu. Impulzné filtrovanie šumu je zredukované na detekciu šumu a korekciu skreslených hodnôt jasu.

Najbežnejšie filtrovacie algoritmy sú založené na predpovedaní hodnoty prvku xmnk z jeho okolitého okolia Vmnk. V tomto prípade sa používajú lokálne korelácie blízkych prvkov obrazu a berie sa do úvahy, že šum je priestorovo dekorelovaný. Pri detekcii sa porovnávajú pozorované hodnoty xmnk a predpokladané hodnoty xmnk. Ak sa líšia o viac ako určitý prah detekcie

5 sa xmnk považuje za obťažujúce a je opravené na hodnotu xmnk.

Všeobecný vzorec na výpočet xmnk ako celku opakuje vzorec (1):

xmnk = /(xijl 1 xijl e Vmnk). (22)

Hodnotu funkcie /( ) nájdete nasledovne. Vyberme skrátenú množinu (xj) z množiny prvkov okolia xijle Vmnk vyradením 2n bodov s najmenšou a najväčšou hodnotou (n ~ QV/8). Množina bodov (x "j) bude zodpovedať takzvanej oblasti členstva. Prenesme si najbližšiu nadrovinu cez body (x" j) a zoberme jej hodnotu v bode (m, n, k). Výsledná hodnota bude požadovaná predpovedaná hodnota xmnk.

Zovšeobecnený vzorec filtrovania pre väčšinu algoritmov bude nasledujúci:

Gxmnk IF Knk - xmnk 1< 5; ^

ymnk = 1 ~ , - , . s (23)

ak Ixmnk - xmnk 1^5.

Pre veľké p, keď je pravdepodobnosť skreslenia dvojice susedných voxelov dostatočne vysoká, sa odporúča iteračný proces filtrovania: spočiatku s veľkou prahovou hodnotou 5, potom s jej postupným znižovaním. Pre prvú iteráciu sa odporúča použiť okolie na obr. 1,a, a pre nasledujúce - okolie na obr. lb a (c).

D. Rozklad obrazu

Pre dvojrozmerný obraz sa v ,, riešili otázky dekompozície, čo v modeli (2) znamená rozdelenie obrazu na vyhladenú S a textúrovo detailnú zložku (t + 4). Podstatou algoritmu v nich prezentovaného je, že pre každý bod obrazu (m, n) sa na základe sekvenčnej analýzy okolia Vmn a fragmentu Wmn obklopujúceho prvok xmn vyberie časť bodov Wmn ako členská oblasť a hodnota Smn sa odhaduje z vybraného súboru.

Algoritmus rozkladu využíva analýzu rozdelenia pravdepodobnosti hodnôt prvkov v okolí Vmn a fragmentu Wmn. Príklad fragmentu pokrývajúceho tri oblasti, ako aj rozloženie hodnôt prvkov na fragmente (histogram) sú znázornené na obr. 3. Oblasťou príslušnosti je v tomto prípade množina bodov objektu a.

Ryža. 3. a) Oblasť analýzy (fragment); b) pravdepodobnostné rozdelenie hodnôt prvkov v rámci fragmentu.

Keďže použitý prístup je založený na analýze rozdelenia pravdepodobnosti, uľahčuje to

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

prejsť z 2D do 3D obrazu - stačí do vzorcov dosadiť trojrozmerné okolie Vmnk a fragment Wmnk namiesto dvojrozmerného okolia Vmn a fragmentu Wmn. V zápise je algoritmus rozkladu trojrozmerného obrazu formulovaný nasledovne.

Pre dané rozmery txlxl, susedstvá Vmnk a LxLxL fragmentu Wmnk (l< L), центрированных в точке (m,n,k), ширине яркостных интервалов анализа А и А, а также ранговых параметрах nV < l3/2 и nW < L3/2 соответственно, значение сглаженной компоненты Smnk в (2) находится выполнением следующих операций для каждой точки (m,n,k) изображения:

1. Pravdepodobnosti distribúcie (histogramy) sú vypočítané pre trojrozmerné susedstvá H^ = ( hVnk (i) ) a fragment H^k = ( hWnk (i) ) so stredom (m,n,k).

2. Na základe histogramu okolia HmVnk a parametra nV sa nájdu hodnoty R = RV(nV/l3) a R = RV(1 - nV/l3); tu sú hodnoty poradia R(x) definované ako riešenia

rovnice £ *=0 ^k (i) = -Г kde hL (i) je histogram hodnôt prvkov v okolí Vmnk. Stredná hodnota x sa zistí porovnaním -mnk s R1 a R2:

XV = -mnk ak R1< -mnk < R1 "; XV = R , если -mnk < R1V ;

a X = R2, ak Xmnk > R1.

3. Z prvkov Vmnk sa vyberie z takých xrmnk e V,

(r = 1,..., z), ktoré spadajú do intervalu (XV - AV, XV + AV), kde AV je jeho polovičná šírka. Na základe hodnôt Xrmnk z daného intervalu sa vypočíta priemer:

Xmnk A(V mnk , Xmnk ,

A(Vmnk, Xmnk, n, A) = - E X

kde XV - AV< Xmnk < XV + AV.

4. Podobne ako v bode 2, podľa histogramu fragmentu H "Wnk and

W r»W r>W/W/t 3\

ak je dané n, nájdu sa hodnoty R1 = R (n /L) a rw = rw(1 - nW/L3). Hodnota XW sa zistí porovnaním

X„„k s RW a RW:

mnk ak RW< Xmrk < RV ; XW = RW ,

RW, ak X„„k > RW

ak Xmnk< R1W ; и X"

5. Vyhladená hodnota Smnk sa nachádza ako medián skráteného histogramu fragmentu HmWnk - tej jeho časti

ktorý sa nachádza v intervale (X - A , X + A):

Smnk = med(Wmk, Xmnk, nW, AW).

Ryža. Obr. 4. Výsledok rozkladu: pôvodný obrázok (vľavo), vyhladená zložka Sn (vpravo) a grafy označenej čiary.

Výsledná hodnota Smnk sa považuje za požadovaný vyhladený komponent. Zjednodušená verzia tohto algoritmu bola neskôr publikovaná pod názvom bilaterálne filtrovanie. Príklad rozkladu dvojrozmerného obrazu s rozmermi 256x256 prvkov s vyhladzovacím fragmentom Wmnk s rozmermi 15x15 prvkov je na obr. štyri.

E. Detekcia objektov daného objemu Ukazuje sa, že vyššie uvedený algoritmus rozkladu možno použiť na detekciu objektov v obraze. Podobne ako pri 2D obrázkoch, pri ktorých sa rieši problém detekcie objektov podľa ich plochy, v trojrozmernej modifikácii je nastolený problém detekcie objektov podľa ich objemu.

Analogicky k dvojrozmernému možno aj trojrozmerný problém formulovať v troch verziách: detekcia objektov s objemom (t.j. počtom prvkov) Nj menším ako daný T1, väčším ako daný T2, a detekcia objektov s objemom v intervale T1< N] < T2.

1) Detekcia objektov s N1 > T Predpokladá sa, že obraz pozostáva z pomerne rovnomerného pozadia (veľká plocha U0), na ktorom je množina malých plôch U1,...,UJ, od seba dostatočne vzdialených. iné a môžete si vybrať určitú veľkosť fragmentu L (L3/2 > T) tak, aby každý fragment Wmnk obsahoval najviac jednu oblasť s N] > T, alebo niekoľko menších, ale pod podmienkou EN1< T (U1 _ W). В п. 5 алгоритма декомпозиции (25) выберем nW= T, a R"W = R(T/L3) и R2W = R(1-T/L3). Обработкой изображения с данными значениями R1W и R2W получим:

tie. vyhladená zložka pôvodného obrazu, na ktorej zostali oblasti s N] > T, detekovaná detektorom s prahovou hodnotou S(U0) ± 5, kde S(U0) je priemerný jas pozadia a 5< mini{IS(U1) - S(U 0)l}; (S(U 1) - яркости соответствующих областей).

2) Detekcia objektu pomocou N1< T

Vyhladený komponent Smnk v (25) obsahuje iba oblasti s N1 > T, zatiaľ čo oblasti s N1< T содержатся в разностной компоненте tmn = (Xmn - ^mn) - Smn. Детекция объектов с N1 < T достигается пороговым обнаружением в точках, где ltmnl >5 (5 - prah detekcie).

3) Detekcia objektu pomocou Tj< N] < T2 Возможны два варианта решения.

V prvom prípade najprv zvolíme nW = T1. Potom vyhladený komponent Smnk v (25) bude obsahovať objekty s N] > T1. Spracujme to znova algoritmom (25) s nW = T2 (T2 > T1). Je zrejmé, že novo získaný vyhladený komponent S'mnk bude obsahovať iba objekty s N1 > T1. Ak vezmeme rozdiel ymnk = ISmnk - S'mnkl, dostaneme signál obsahujúci objekty v rozsahu T1< N] < T2. Недостаток данного решения - алгоритм получается двухпроходовым.

Druhá možnosť. Všimnite si, že pri analýze histogramov podľa okolia a fragmentu sa používajú dva rôzne prahové hodnoty (nV a nW). Veľkosti okolia l a fragmentu L volíme väčšie ako zvyčajne – také, že l3 > 2T1 a L3 > 2T2. Dané R1V a RV ako

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

RV = RV(T1/l2) a RV = RV(1 - TR/2), po operácii (24) budeme mať xmnk, ktorý už neobsahuje oblasť s N]< Т1. Далее в п. 5 алгоритма декомпозиции, при анализе HW, зададим RW и R2W как RW = RW(T2/L3) и rw = rw(1 - t2/l3). Получив значение Smnk в (25), возьмем разность ymnk = I xmnk - Smnk\, на которой объекты выделяются пороговым обнаружением.

Všimnite si, že pojem plochy v dvojrozmernom prípade aj pojem objemu v trojrozmernej verzii algoritmu sa používajú v trochu nezvyčajnom zmysle - ako "lokálny" objem, t.j. objem tej časti objektu, ktorá spadá do fragmentu Wmnk.

VII. Niektoré výpočtové algoritmy

A. Súčet na pravouhlom rovnobežnostene Zavedme zápis súčtu nad fragmentom 2D obrazu:

tie. S(j)(mn) - súčet hodnôt prvkov xuv spadajúcich do obdĺžnikového fragmentu, ktorého diagonálne body majú súradnice (i,j) a (m-1,n-1). Všimnite si, že fragment nezahŕňa bod so súradnicami (m, n) a zodpovedajúci riadok a stĺpec. Podobne pre 3D obrázok, S(ijl)(mnk) je súčet hodnôt prvkov xijl v kvádri s rohovými súradnicami (i,j,l) a (m-1,n-1,k-1 ):

Pre dvojrozmerný obrázok klasický spôsob výpočtu súčtu S(mn)(m+Hn+L) cez posuvný obdĺžnikový fragment s rozmermi prvkov HxL pri prechode z prvku (m,n) na prvok (m, n+1) sa zredukuje na vzorec

S(m,n+1)(m+H,n+L+1) S(m,n)(m+H,n+L) S(m,n)(m+H,n+1)+ S(m,n+L)(m+H,n+L+1), (26)

kde posledné dva členy sú súčty prvkov nad ľavým (odstráneným) a pravým (pridaným) stĺpcom fragmentu. Algoritmus vyžaduje 4 operácie bez ohľadu na veľkosť fragmentu - 2 operácie vo výraze (26) a dve operácie na prepočítanie každého zo súčtov v stĺpci S(m,n)(m+H,n+V) pri prechode z riadok m až riadok m+ 1. Okrem toho je potrebných N buniek na ukladanie súčtov podľa stĺpcov.

Pri prepnutí na 3D obraz sa vzorec (26) upraví na posuvný obdĺžnikový hranol s rozmermi VxDxJ:

S(m,n,k+1)(m+H,n+L,k+J+1) S(m,n,k)(m+H,n+L,k+J) S(m, n,k)(m+H,n+L,k+1)+ + S(m,n,k+J)(m+H,n+L,k+J+1), (27)

kde posledné dva členy sú súčty prvkov pozdĺž ľavej (odstránenej) a pravej (pridanej) plochy

rovnobežnosten. Tento algoritmus už vyžaduje 6 aritmetických operácií, bez ohľadu na veľkosť fragmentu - 2 operácie vo výraze (27), dve operácie na prepočítanie každého zo súčtov pozdĺž plôch a dve na prepočet súčtov pozdĺž stĺpcov. Okrem toho potrebujeme K

buniek na uloženie poľa súčtov a NxK buniek na uloženie súčtov stĺpcov.

Pre dvojrozmerný obrázok je známy aj iný algoritmus na výpočet súčtu pre obdĺžnik ľubovoľnej veľkosti. Nech sa vypočíta súčty Smn = S(0,0)(m,n) pre každý bod (m,n) nad obdĺžnikom s diagonálnymi prvkami x00 a xm-1,n-1. Potom súčet S(ij)(mn) hodnôt prvkov vo vnútri obdĺžnika s rohovými súradnicami (i, j) a (m-1,n-1) bude:

S(ij)(mn) Smn Sm,j Si,

ktorý v priemere pre každý prvok obrázka vyžaduje 2 operácie na výpočet súčtu Smn a 3 operácie na výpočet podľa vzorca (28). Na uloženie súčtu Smn sú však už potrebné bunky MxN, ktoré sa rovnajú veľkosti obrázka. Výhodou je, že pre rovnaké 3 operácie je možné vypočítať S(ij)(mn) pre ľubovoľné hodnoty súradníc, nielen pre posuvný fragment.

Algoritmus (28) je možné upraviť aj pre 3D obraz. Nech sa pre každý bod (m,n,k) vypočítajú súčty Smnk nad pravouhlým rovnobežnostenom s diagonálnymi prvkami x000 a xm-1,n-1,k-1, t.j. Smnk = S(ooo)(mnk). Je ľahké ukázať, že v tomto prípade súčet S(ijl)(mnk) hodnôt prvkov vo vnútri krabice s uhlovými súradnicami (i, j, l) a (m-1,n-1,k- 1) sa vypočíta pomocou nasledujúcej operácie:

S(ijl)(mnk) = Smnk -Smjk -Smnl -Sink +Smjl +Sijk +Sinl -Sijl. (29)

Ak teda vezmeme do úvahy skutočnosť, že na výpočet každej hodnoty Smnk sú potrebné 3 aritmetické operácie, na výpočet súčtu S(ijl)(mnk) pre každý prvok trojrozmerného obrazu bude v priemere potrebných 10 aritmetických operácií. Množstvo dodatočne potrebnej pamäte bude MxNxK buniek s kapacitou postačujúcou pre hodnoty súčtov Smnk.

Podobne je možné nájsť disperzie na fragmente D(ijl)(mnk) výpočtom hodnôt súčtu štvorcov S(mnk)(x2) pre každý z bodov (m,n,k) a pre pravouhlý rovnobežnosten S(ijl)(mnk)(x2) a potom pomocou vzorca

D(ijl)(mnk) = (S(ijl)(mnk)(x) - (S(ijl)(mnk)) )/N(ijl)(mnk), (30)

kde S(ijl)(mnk)(x2) je súčet druhých mocnín hodnôt prvkov, ktoré spadajú do rámčeka, a celkový počet bodov v rámčeku je N(ijl)(mnk) = ( m-i)x(n-j)x(k-1).

B. Štatistika poradia na kvádri

Základom pre výpočet poradovej štatistiky pre fragment W 2D aj 3D obrazov je histogram rozdelenia hodnôt jasu pre tento fragment hW(x), ako aj jeho integrálna charakteristika FW(x):

FW (x) = Z hW (i); FW(xmax) = NW, (3 1)

kde xmax je maximálna možná hodnota jasu a NW je počet bodov vo fragmente W. Poradová štatistika v tvare RW(n), kde 0< n < NW, представляют собой зависимость:

RW(n) = z ak FW(z-1)< n < FW(z). (32)

Algoritmus pre posuvný výpočet histogramu podľa

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

fragment je konštruovaný podobne ako vo vzorcoch (26) a (27), t.j. Keď sa fragment presunie na ďalší bod, body sa odstránia na jednej strane fragmentu a body sa pridajú na opačnej strane. V dvojrozmernom prípade vyžaduje algoritmus výpočtu posuvného histogramu cez fragment pri pohybe z bodu (m, n) do susedného bodu (m, n + 1) priemerne 2H počet operácií (H je počet riadkov vo fragmente). V trojrozmernom prípade pri prechode z bodu (m, n, k) do bodu (m, n, k + 1) budú potrebné operácie 2HxL, kde HxL je počet bodov na ploche rovnobežnosten kolmý na smer posunu K.

V trojrozmernom prípade počet požadovaných operácií rastie úmerne k súčinu HxL. Ak však (HxL) > (xmax+1), tak namiesto operácií s hodnotami jednotlivých bodov je výhodné vyhotoviť histogramy pre steny kvádra hj)(mnk+1)(x) a

potom vykonajte operácie odčítania a sčítania takýchto histogramov:

hW(x) = hW(x) - hF(x) +

h(i,j,k+1Xm,n,k+J+1)(x) h(ijk)(m,n,k+J)(X) h(ijk)(m,n,k+1) (X)

H(i,j,k+J)(m,n,k+J+1)(X),

kde J je veľkosť fragmentu v smere posunutia K. Akcie podľa vzorca (33) vyžadujú v priemere 2 (xmax+1) aritmetické operácie na bod snímky, bez ohľadu na veľkosť rámčeka. Na prepočet histogramov pozdĺž plôch kvádra hfjk)(mnk+1)(x)

okrem toho je na uloženie K histogramov potrebných v priemere 2L operácií na bod a (xmax+1)xK pamäťových buniek.

Počet operácií (xmax+1) potrebných na pridanie/odčítanie každého z histogramov pozdĺž plôch kvádra hFjk)(mnk +1)(x) možno znížiť, ak

využiť priestorovú koreláciu spracovávaných údajov. V oblastiach s pomalou zmenou jasu, ktorých je na reálnych snímkach zvyčajne väčšina, je rozsah hodnôt prvkov relatívne malý - niekoľkonásobne menší ako celý rozsah (xmax+1) gradácií. Pridanie ku každému z histogramov hFjk)(mnk +1)(x) 2 bunky pre

zapamätanie si minimálnej a maximálne hodnoty distribúcie, a teda spracovaním len určeného rozsahu gradácií je možné dodatočne niekoľkonásobne znížiť celkový počet operácií.

VIII. Záver

Zvažuje sa problematika modifikácie dvojrozmerných modelov a algoritmov spracovania obrazu aplikovaných na trojrozmerné obrazy. Zobrazia sa možnosti zmeny oblasti analýzy, algoritmov filtrovania, rozkladu obrazu a detekcie objektov, ktoré sa dajú relatívne ľahko upraviť pri prechode z 2D na 3D obrazy. Navrhujú sa výpočtové algoritmy, ktoré znižujú počet operácií pri určovaní hodnôt strednej a ordinálnej štatistiky pre posuvný fragment pre 3D obraz.

Bibliografia

Toriwaki J., Yoshida H. Základy trojrozmerného digitálneho spracovania obrazu. New York: Springer, 2009.

Krasilnikov N. Digitálne spracovanie 2D a 3D obrazu. Petrohrad: BHV-Petersburg, 2011.

Gonzalez R., Woods R. Digitálne spracovanie obrazu. M.: Technosfera, 2012.

Chochia P.A. "Dvojrozmerný obrazový model". V knihe.

Kódovanie a spracovanie obrazu. Moskva: Nauka, 1988, s. 69-87.

Chochia P.A. Spracovanie a analýza snímok na základe modelu v dvoch mierkach: Predtlač IPPI AN ZSSR. M.: VINITI, 1986.

Ahmed N., Rao K. Ortogonálne transformácie v digitálnom spracovaní signálov. Moskva: Komunikácia, 1980.

Chochia P.A. Vylepšenie obrazu pomocou posuvných histogramov. Počítačové videnie, grafika, spracovanie obrazu, 1988, roč. 44, č. 2, str. 211-229.

Pratt W. Digitálne spracovanie obrazu. M.: Mir, 1982. Zväzok 1, 2.

Roberts L. „Automatické vnímanie 3D objektov“. V knihe. integrované roboty. M.: Mir, 1973, S. 162-208.

Chochia P.A. „Digitálne filtrovanie impulzného šumu na televíznych obrazoch“. Komunikačná technika: ser. Televízna technika, 1984, číslo 1, s. 26-36.

Chochia P.A. "Vyhladenie obrazu pri zachovaní okrajov." V knihe. Kódovanie a spracovanie obrazu. M.: Nauka, 1988, S. 87-98.

Chochia P.A. „Niektoré algoritmy detekcie objektov založené na dvojúrovňovom modeli obrazu“. Informačné procesy, 2014, roč.14, č.2, s.117-136.

Lee J.S. „Digitálne vyhladzovanie obrazu a Sigma filter“. Počítačové videnie, grafika, spracovanie obrazu, 1983, roč. 24, č. 2.pp. 255-269.

Tomasi C., Manduchi R. "Bilaterálne filtrovanie pre sivé a farebné obrázky." Proc. IEEE 6th Int. Conf. on Computer Vision, Bombay, India, 1998, str. 839-846

Chochia P.A. „Paralelný algoritmus na výpočet pohyblivého histogramu“. Autometria, 1990, č. 2, s. 40-44.

Chochia P.A. "Modifikácia modelu a algoritmov spracovania pri prechode z dvojrozmerných na trojrozmerné obrázky." V knihe. IX

Medzinárodná vedecká a praktická konferencia „Modern Informačné technológie a IT vzdelávanie." Zborník vybraných prác. M.: MsÚ, 2014, s. 820-833.

International Journal of Open Information Technologies ISSN: 2307-8162 roč. 2, č. 11, 2014

Trojrozmerné a dvojrozmerné obrazy: úprava obrazového modelu, algoritmy spracovania plošnej analýzy

Abstrakt – formulujú sa špecifiká trojrozmerných obrázkov. Študuje sa prispôsobenie analyzovanej oblasti a dvojrozmerného obrazového modelu na 3D obrazy. Sú demonštrované modifikácie rôznych algoritmov spracovania obrazu na 3D obrazy. Navrhujú sa rýchle algoritmy na výpočet miestneho priemeru a štatistiky objednávok v pohyblivom okne pre 3D obrázky.

Kľúčové slová - Spracovanie obrazu, trojrozmerný obraz, obrazový model, algoritmus spracovania obrazu, oblasť analýzy, rýchle algoritmy.

2D(dva rozmery) - druh počítačovej grafiky. Takýto obrázok bude vždy vyzerať plocho, pretože používa iba dva rozmery - šírku a výšku. Používa sa na vytváranie log, máp, webových stránok, reklamných bannerov, v hrách a rozhraniach aplikácií, karikatúr a videí. Aj keď 2D grafika vyzerá plochý obraz, vďaka tieňom môžete dosiahnuť efekt trojrozmerných objektov (nie však fotorealizmus).

Usporiadanie reklamných materiálov vytvorené pre Museo Argentino de Ciencias Naturales (Múzeum prírodných vied, Buenos Aires). Autor: Lucas Rod.


Video k jednému z projektov Rijksmuseum. Videosekvencia obsahuje zábery 211 diel z online zbierky múzea.


Interaktívna hra pre deti o živote dinosaurov, kreslená v 2D grafike.

Existujú tri typy 2D grafiky:

  • Vektorová grafika: obrázok je reprezentovaný ako geometrické tvary, ktorý poskytuje maximálnu presnosť zostrojeného obrazu. Tento obrazový formát sa dá ľahko upravovať, meniť jeho mierku, otáčať, deformovať a umožňuje simulovať trojrozmernosť. Medzi nedostatky vektora možno zaznamenať nedostatok realizmu a neschopnosť používať efekty. Vektorová grafika je vhodná na kreslenie kresieb a diagramov, používa sa na škálovateľné fonty, obchodnú grafiku, prvky knižných značiek (logá, ozdobné vzory atď.), ktoré sa používajú na vytváranie karikatúr a rôznych reklám, ako aj na tlač (poskytuje vysokú kvalitu obrazu).
  • Rastrová grafika: obrázok sa skladá z bodov rôznych farieb (tzv. pixelov), ktoré tvoria riadky a stĺpce. Takéto obrázky sú vysoko realistické vďaka možnosti použitia rôznych efektov. Nevýhodou rastrového formátu je slabá škálovateľnosť (pri zmenšení alebo zväčšení obrázku sa stráca jeho kvalita).
    Formáty rastrových obrázkov sa používajú pri vytváraní webových stránok na internete, mobilných aplikácií, akýchkoľvek rozhraní, v digitálna maľba atď.

    Príklad ilustrujúci rozdiel medzi vektorovým a rastrovým obrázkom.

    Vzorová aplikácia múzea pre dotykové zariadenia:

  • Fraktálna grafika: obrázok sa skladá z častí, ktoré sú v istom zmysle podobné celku – zväčšené časti objektu pripomínajú samotný objekt a navzájom. V počítačovej grafike sa fraktály používajú na vytváranie obrázkov prírodných objektov, ako sú stromy, kríky, horské krajiny, morské povrchy atď.

    Interaktívna inštalácia v

Z dvojrozmerného obrazu si človek dokáže poskladať veľmi kompletnú predstavu o vzdialenostiach k zobrazeným predmetom, ich tvare a veľkosti, a tak plne vnímať trojrozmerný svet v celej jeho hĺbke. Ako to dosiahneme?

Ako viete, človek s pomocou očí priamo vidí presne dvojrozmerný obraz. To, čo vidíme, sa dá zachytiť napríklad kamerou, vytlačiť na list papiera (t.j. v dvojrozmernej rovine) a zavesiť na stenu, takže obraz, ktorý do nášho mozgu vstupuje z očí, je dvojrozmerný. .

Pri pohľade na skutočné predmety, na fotografie a pri sledovaní videí sa nám však z týchto dvojrozmerných obrázkov podarí vytiahnuť toľko informácií, že sa nám začnú zdať trojrozmerné. Vzájomnú polohu predmetov v priestore vnímame veľmi dobre iba zrakom. Typ videnia, ktorý vám umožňuje vnímať tvar, veľkosť a vzdialenosť predmetov, sa nazýva stereoskopické videnie. Osoba má takúto víziu a dosahuje ju nasledujúcimi účinkami:

  1. binokulárne videnie. Muž má dve oči. Na sietnici každého oka sa vytvorí mierne odlišný 2D obraz tej istej 3D scény. Na základe životných skúseností a obrovských výpočtových schopností si mozog porovnaním týchto dvoch mierne odlišných obrázkov vytvorí predstavu o trojrozmernosti obrázku. Tento efekt funguje najlepšie pri pozorovaní blízkych predmetov, ktorých vzdialenosť je aspoň ako-tak porovnateľná so vzdialenosťou medzi očami. Pri prezeraní objektov, ktoré sú vzdialené viac ako päť metrov, tento efekt takmer neovplyvňuje. Hneď si tiež rezervujeme, že vzhľadom na to, že binokulárne videnie nie je jediným faktorom, ktorý umožňuje vidieť v 3D, a keďže jeho rozsah je obmedzený na niekoľko metrov, absencia dvoch očí by nebola katastrofou pre osobu. Stále by sme boli schopní vidieť v 3D, len by nám zabralo viac životných skúseností a času, kým by sme sa naučili aplikovať zvyšok efektov. Toto tvrdenie sa potvrdzuje veľmi ľahko. Stačí zavrieť jedno oko. Prestali ste vidieť v 3D? Nie!
  2. Posun predmetov pri pohybe pozorovateľa. Keď sa pozorovateľ pohybuje, obraz, ktorý vidí, sa neustále mení, pričom blízke objekty menia svoju polohu na tomto obrázku oveľa rýchlejšie ako vzdialené, ktoré pomaly menia svoju polohu v zornom poli pozorovateľa. A opäť veľa životných skúseností a výpočtové schopnosti mozgu umožňujú dobre vnímať vzdialenosť k nim rýchlosťou pohybujúcich sa objektov v zornom poli. Mimochodom, skutočným posunutím jedného oka na vzdialenosť rovnajúcu sa vzdialenosti medzi očami môžete nahradiť binokulárne videnie, pretože mozog bude nakoniec schopný porovnať rovnaké dva obrázky ako z dvoch očí naraz. Tento spôsob si však vyžaduje veľa úsilia a neustáleho pohybu a snímky nebudú zachytené v rovnakom čase, t.j. už môže byť iný. Preto je binokulárne videnie stále veľmi užitočnou možnosťou, ktorá veľmi pomáha pri práci s blízkymi predmetmi, čo človek bežne robí.
  3. Životná skúsenosť. Väčšina ľudí má dobrú predstavu o veľkosti mnohých známych predmetov, ako sú stromy, iní ľudia, autá, okná, dvere atď. S týmito znalosťami môžete urobiť dobrý odhad vzdialenosti k jednému z týchto objektov (a teda k objektom, ktoré sa nachádzajú v blízkosti), v závislosti od toho, akú časť celkového zorného poľa zaberajú. Napríklad hneď uhádnete, že dievča na fotografii nižšie sa nachádza oveľa bližšie k pozorovateľovi ako veža, na ktorej vrchol údajne siaha...
  4. Dym vzdialených predmetov. Atmosféra má stále určitý stupeň nepriehľadnosti. Preto sa veľmi vzdialené predmety javia ako dymové. Takže podľa stupňa dymu je možné určiť, ktorý zo vzdialených objektov sa nachádza ďalej a ktorý je bližšie k pozorovateľovi. Je to veľmi užitočný efekt, pretože iné metódy konštrukcie trojrozmerného obrazu nefungujú dobre pre vzdialené objekty.
  5. Perspektíva, tiene a osvetlenie. Podľa konfigurácie tieňov a stupňa osvetlenia tej či onej časti objektu mozog na základe rozsiahlych životných skúseností dobre vníma tvar predmetov. Perspektíva je efekt, podľa ktorého sú napríklad dve rovnobežné čiary v priestore konvergujú k bodu na obrázku vo veľkej vzdialenosti od pozorovateľa. Mozog je vďaka tomuto efektu schopný veľmi dobre vnímať informácie, ktoré k nemu prichádzajú.
  6. Schopnosť oka zaostriť len na jednu vzdialenosť. Oko, ako každé optické zariadenie, nevidí obraz rovnako dobre v celej jeho hĺbke, dokáže zaostriť len na určitý špecifický rozsah. Vidíme teda najjasnejšie predmety, v ktorých sa nachádzame tento moment sú zaostrené a bližšie a vzdialené objekty sa zdajú byť mierne rozmazané. Mozog má informácie o tom, ako ďaleko sú oči momentálne zaostrené. Zameraním pohľadu na rôzne vzdialenosti sme teda schopní akoby naskenovať celý priestor v celej jeho hĺbke.
  7. Blízke predmety zakrývajú vzdialené. Tento zjavný efekt, aj keď sa zdá byť veľmi jednoduchý, predsa len veľmi prispieva k vytvoreniu trojrozmerného obrazu. Nie je totiž nič jednoduchšie, ako pochopiť, že jeden objekt je ďalej ako druhý, ak je nimi čiastočne uzavretý.

Obrázok vysvetľujúci bod č. 3.

Obrázok vysvetľujúci bod č. 4.

Obrázok vysvetľujúci bod č. 5.

Obrázok vysvetľujúci položku č. 6.

Po tom, čo sme si povedali o všetkých efektoch, na základe ktorých nám naše videnie umožňuje vnímať trojrozmerný obraz, môžeme ešte jednu malú poznámku o 3D kine.

Faktom je, že v každom filme sa používajú všetky vyššie uvedené efekty, s výnimkou úplne prvého - „binokulárneho videnia“. No a v 3D kine sa kvôli špeciálnym technológiám pridáva aj binokulárnosť. Pri sledovaní filmov v 3D tvoria okuliare pre každé oko trochu iný obraz.

Treba však poznamenať, že to výrazne nezlepšuje obraz. Koniec koncov, ako už bolo spomenuté, s pomocou jedného oka, s množstvom životných skúseností, môžete skutočne vidieť celú hĺbku obrazu bez straty kvality (kvôli ďalším šiestim efektom použitým v akomkoľvek filme).

Navyše, binokulárne videnie je užitočné na krátke vzdialenosti a vo filmoch často vidíme skôr široké scény, než aby sme si prezerali malé objekty zblízka, takže tento efekt často nie je vôbec badateľný.



Podobné články