Twoim problemem jest to, że powszechną NICOŚĆ mylisz z osobistą PUSTKĄ
Zakład Fotogrametrii, Teledetekcji i Systemów Informacji Przestrzennej
SPRAWOZDANIE
grupa 1b
semestr 6
25.05.2009r.
Adam Dąbrowski
Wprowadzenie
Niniejsze sprawozdanie zostało sporządzone na podstawie ćwiczeń z przedmiotu Systemy Informacji Przestrzennych odbywających się na semestrze szóstym. Ujęto w nim następujące tematy:
1. Skanowanie map papierowych.
2. Korekcja geometryczna obrazów zeskanowanych map oraz zdjęć satelitarnych.
3. Pozyskiwanie danych dla SIP.
4. Wektoryzacja.
W sprawozdaniu tym, postaram się zawrzeć podstawy teoretyczne, istotę wykonywanych ćwiczeń oraz własne spostrzeżenia i komentarze, które nasunęły się w trakcie wykonywania ćwiczeń i analizowania ich rezultatów.
Większość zadań (takich jak korekcje geometryczne czy wektoryzację) wykonywaliśmy w aplikacji ArcMap firmy ESRI.
I. Skanowanie map papierowych
Współczesna kartografia, a także Systemy Informacji Przestrzennej posługują się informacjami zawartymi w danych pod postacią plików komputerowych. Mimo tempa rozwoju i postępu komputeryzacji, wciąż mamy do czynienia z wieloma opracowaniami map, w tradycyjnej papierowej formie. Aby informacje przestrzenne zawarte w tego typu formie ich prezentacji, przekształcić do postaci plików, obraz fragmentu terenu na mapie musi zostać wektoryzowany. Jednakże zanim to się stanie, musi zostać zeskanowany i w postaci obrazu zapisanego w postaci macierzowej, gdzie każda wartość stanowi jego piksel, zapisany w pamięci komputera.
Na przeprowadzonych ćwiczeniach do skanowania posłużył nam skaner z tradycyjną ruchomą linijką CCD (Couple Charged Device) firmy Pustek o formacie A3, oraz komercyjne oprogramowanie. Fragment mapy zeskanowano w różnych rozdzielczościach oraz zapisano w różnych formatach plików w celach porównawczych.
Obraz można zeskanować z bardzo dużą rozdzielczością, a następnie zapisać w formacie pliku, który praktycznie nie posiada żadnej kompresji zapisanych danych. Takie rozwiązanie pomimo swojej niewątpliwej przydatności do wektoryzacji, jest niepraktyczne przede wszystkim ze względu na zbędnie duży rozmiar pliku który będziemy przekształcać. To oznacza większe zużycie pamięci na dysku twardym, oraz większe zapotrzebowanie mocy obliczeniowej komputera, w trakcie obróbki takiego obrazu. Jest to również wydłużenie czasu skanowania, czyli wydłużenie całego procesu pozyskiwania danych przestrzennych.
Tutaj pojawia się pytanie – jaka rozdzielczość i format danych jest wystarczający dla przeprowadzenia wektoryzacji, a jednocześnie nie obciąża zbytnio sprzętu na którym pracujemy.
Rozdzielczość ludzkiego oka pozwala na widzenie obiektów o wielkości nie mniejszej niż 0,1mm. Biorąc pod uwagę rozdzielczość samego wydruku mapy oraz jego niedokładność, błąd odczytu lokalizacji obiektów z mapy należałoby nieco zwiększyć. Zostaniemy jednak przy założeniu, że jest to 0,1mm.
Rozdzielczość obrazu zapisywanego w postaci pliku podawana jest zazwyczaj w jednostkach dpi (dots per inch) lub równoważnym ppi (points per inch), co oznacza ile pikseli mieści się w jednym calu (liniowo). Jeden cal międzynarodowy równa się 25,4mm.
Jeśli nie jesteśmy w stanie rozróżnić obiektów mniejszych niż 0,1mm, to i tak właśnie powinna być maksymalna wielkość piksela pozyskanego obrazu, stąd:
0,1mm x N = 1’’ (25,4mm)
N = 25,4mm/0,1mm
N = 254
, gdzie N – poszukiwana minimalna rozdzielczość w dpi.
W praktyce najczęściej stosuje się „równe” rozdzielczości, tzn. 100, 150, 200, 300, 600, 1200 dpi. Skanując mapę z rozdzielczością 300 dpi otrzymamy wystarczająco czytelny obraz do przeprowadzenia wektoryzacji. Wykonując ćwiczenie skanowanie przeprowadzono z większymi rozdzielczościami i nietrudno było zauważyć polepszanie jakości skanu wraz ze wzrostem rozdzielczości, jednakże różnica pomiędzy rozdzielczością 400, a 600 dpi była bez praktycznego znaczenia dla wektoryzacji, natomiast różnica pomiędzy minimalną rozdzielczością 254, a 300 dpi była dość istotna, co pozwala sądzić, że ten niewielki „zapas” ilości pikseli w calu jest korzystny.
Kiedy określimy już wystarczającą rozdzielczość i obraz zostanie zeskanowany, musimy określić format pliku, do jakiego zostanie on zapisany. Różne formaty zapisu obrazów to przede wszystkim różne sposoby kompresji danych. Kompresja jest to nic innego jak redukcja wielkości pliku przy wykorzystaniu metod:
· kompresji bezstratnej
· kompresji stratnej
Zmniejszenie rozmiaru pliku pozwoli nam zwiększyć wydajność opracowywania zeskanowanych obrazów map, oraz zaoszczędzi przestrzeń w pamięci komputera. Wielkość pliku obrazu zależy od jego rozdzielczości pikselowej (dots per inch) oraz rozdzielczości radiometrycznej. W przypadku pliku 8-bitowego, piksel możemy zapisać w przedziale wartości od 0 do 255, ponieważ ilość wartości możliwych do przypisania obliczymy ze wzoru:
2n = R
, gdzie n – liczba bitów, R – liczba wartości, które możemy przypisać,
i tak dla powyższego przykładu: 28 = 256
Taką wielkość będzie miał plik z obrazem o 256 odcieniach szarości. W przypadku zapisu obrazu kolorowego, istniały będą trzy macierze – każda dla jednego z kolorów: R – czerwony (red), G – zielony (green), B – niebieski (blue). Kombinacja wartości radiometrycznych trzech warstw dla jednego piksela, umożliwi zapisanie obrazu z ilością barw równą:
(28)3 = 224 ≈ 16,8 mln
Rozmiar (zajmowana przestrzeń w pamięci) jednego piksela takiego obrazu będzie równy trzykrotności rozmiaru piksela o 256 odcieniach szarości, czyli 3*8 = 24 bity. Czyli zeskanowany fragment mapy o rozmiarze 200x200mm, z rozdzielczością 300dpi, o 16,8mln kolorów, zapisany bez kompresji będzie miał rozmiar:
P – liczba pikseli w obrazie
P = (200/25,4*300)2 ≈ 5580012
B – zajmowana przestrzeń w pamięci
B = P * 24bity = 133920288b = 16740036B ≈ 15,96MB
Natomiast ten sam fragment zeskanowany z rozdzielczością 600dpi będzie miał rozmiar:
P ≈ 22320045
B = 535681080b ≈ 63,86MB
, a więc wraz z dwukrotnym wzrostem rozdzielczości, rozmiar nieskompresowanego pliku wzrósł nieco ponad cztery razy. Wnioskujemy z tego, że: obraz o większej rozdzielczości będzie zajmował D2 razy więcej miejsca niż obraz o mniejszej rozdzielczości, gdzie D – krotność rozdzielczości obrazu o mniejszej rozdzielczości, dla obrazu o rozdzielczości większej.
Kompresja bezstratna umożliwia odtworzenie skompresowanego pliku do postaci pierwotnej, bez utraty jakichkolwiek danych w nim zawartych. Pliki obrazów realizowane tą metodą to m. in. PNG (Portale Network Graphics), GIF (Graphics Interchange Format), TIFF (Tagged Image File Format).
Metoda kompresji stratnej charakteryzuje się przeważnie, mniejszym rozmiarem skompresowanych plików, jednak dekompresja danych wiąże się z utrata mniejszej lub większej ilości danych. Metodą stratnej kompresji zapisywane są pliki: najpopularniejszy - JPEG (Joint Photographic Experts Group) i jego nowsza wersja JPEG 2000, jak również format TIFF, który udostępnia wiele rodzajów kompresji (zarówno stratnej, jak i bezstratnej).
Istnieją również pliki graficzne, które w trakcie zapisu nie są poddawane kompresji, np. XCF – mapa bitowa programu GIMP, PSD – mapa bitowa (wielowarstwowa) programu Adobe Photoshop, jak również popularny BMP – wykorzystywane przez program MS Paint.
ArcMap posługuje się również plikami graficznymi, kompresowanymi, o rozszerzeniu IMG.
Poniżej prezentuję cechy najważniejszych formatów plików obrazów.
JPEG
GIF
PNG
TIFF
+ szeroko rozpowszechniony
+ szeroka paleta barw: do (28)3 = 224 = 16, 8 mln (tzw. True Color )
+ dobrze sprawdza sie w przypadku obrazów o łagodnych przejściach tonalnych,
zarówno wielobarwnych, jak i w odcieniach szarości (np. fotografie)
+ obsługuje tryb progresywny
+ istnieją rozszerzenia standardu i modyfikacje algorytmu kompresującego
(JPEG-LS, JPEG 2000)
+ istnieją wolne (niekomercyjne i nieopatentowane) implementacje
– kompresja stratna
– w procesie kompresji z obrazu usuwane sa drobne szczegóły
– istnieje wiele formatów plików, w których wykorzystuje sie algorytm JPEG,
który sam w sobie nie został dokładnie sprecyzowany — niektóre są
niezgodne ze sobą lub używane przez nieliczne programy
+ szeroko rozpowszechniony
+ kompresja bezstratna (algorytm LZW)
+ małe rozmiary plików
+ dobrze sprawdza sie w przypadku obrazów składających sie z dużych
obszarów o jednolitej barwie (np. wykresy „tortowe”) i/lub szczegółowych
oraz z ostrymi krawędziami (np. wykresy, rysunki, siatki, szkice)
+ można zapisać informacje o przezroczystości wybranego koloru
+ istnieją rozszerzenia standardu pozwalające na zapis animacji
– niewielka paleta barw: maksymalnie 28 = 256 (tzw. tryb indeksowany)
– obrazy o dużej rozpiętości tonalnej sa „redukowane” do 256 kolorów przed
wykonaniem kompresji, przez co traca na jakości
– format był do niedawna objęty patentami
+ kompresja bezstratna
+ łączy zalety JPEG i GIF: dobrze sprawdza sie zarówno w przypadku obrazów
o płynnych przejściach tonalnych wielobarwnych i w odcieniach szarości
(paleta barw do do ok. 16, 8 mln kolorów), jak i GIF (pełna 8-bitowa
przezroczystość [tzw. kanał alfa] oraz paleta barw od 2 do 256 kolorów)
+ obsługuje korekcje gamma, tryb progresywny i kontrole poprawności pliku
+ obsługuje różne głębokości bitowe (do 48 bitów na piksel)
+ algorytm i format sa wolne od patentów
+ zalecany przez W3C (World Wide Web Consortium) jako do reprezentacji
grafiki rastrowej w sieci Web
– nie obsługuje animacji (istnieje osobny format do tego celu [MNG] oparty na
algorytmie PNG)
– nieprawidłowo obsługiwany przez przeglądarkę Internet Explorer < 7.0
– niektóre programy nie obsługują wszystkich właściwości PNG
– występują problemy z obsługa korekcji gamma w przeglądarkach
+ szeroko rozpowszechniony
+ kompresja bezstratna (brak kompresji, algorytm LZW, algorytm CCITT
Group 4) i stratna (algorytm JPEG)
+ szeroka paleta barw: od 2 do ok. 16, 8 mln
+ obsługuje różne głębokości bitowe (do 48 bitów na piksel) oraz przestrzenie
barw
+ obsługuje tryb wielostronicowy (multipage) — zostało to wykorzystane
np. w faksach
+ obsługuje przezroczystość i profile barw
+ specyfikacja formatu umożliwia jego rozszerzanie o dodatkowe znaczniki (za
zgoda właściciela praw autorskich do formatu TIFF)
– mogą występować problemy z odczytem plików TIFF w niektórych
programach
– format jest objęty patentami
Zeskanowany fragment mapy, w skali 1:50000, zapisaliśmy do plików: JPG, IMG oraz TIFF. Moim zdaniem obraz JPG wypadł widocznie słabiej, aczkolwiek zależy to również od zastosowań, do których chcemy wykorzystać obraz. W przypadku wektoryzacji manualnej, sprawdziłyby się wszystkie formaty zapisu. Natomiast do wektoryzacji półautomatycznej, gdzie wskazana jest większa kontrastowość, najlepszym byłby obraz w formacie IMG. Obraz JPG o najniższej kontrastowości pozwalał na lepsze rozróżnianie obiektów o zbliżonej barwie, lecz nie gwarantował ciągłości barwy danego obiektu, co ma znaczenie przy wektoryzacji półautomatycznej i automatycznej.
II. Korekcja geometryczna
Zdjęcie cyfrowe możemy otrzymać na dwa sposoby:
· skanowanie zdjęć analogowych (bądź map)
· wykorzystanie specjalnych skanerów i kamer cyfrowych – zdjęcia lotnicze lub satelitarne
Obie powyższe metody obciążone są pewnymi deformacjami pozyskanego materiału, związanych z niedoskonałością oprzyrządowania lub sposobem otrzymywaniem obrazu. Obraz uzyskany ze zdjęcia lotniczego lub scena satelitarna będą posiadały znacznie większe zniekształcenia – spowodowane właśnie, techniką ich wykonywania, aniżeli zeskanowana mapa czy też jej fragment, gdzie w...