Czy zastanawialiście się nad tym jakiej rozdzielczości obraz widzimy przed sobą w codziennym życiu? Czy to 4K, 8K czy może tylko 2K? Z dr. inż. Marcinem Witkowskim z Wydziału Mechatroniki Politechniki Warszawskiej rozmawiamy na temat widzenia, postrzegania szczegółow i oglądaniu obrazu wysokiej rozdzielczości.
Rozmawiał: Jarek Somborski
Przekrój oka ludzkiego. W powiększeniu pręciki i czopki
fot. www.scientificanimations.com
Poniższy tekst jest skrótem tekstu który ukazał się na łamach FilmPRO. Publikujemy go z drobnymi zmianami zostawiając esencję. Od chwili pojawienia się tekstu, tematyka o której piszemy nie straciła nic ze swojej aktualności.
Jak to się dzieje, że w ogóle widzimy?
Promienie światła docierają przez soczewkę na dno oka, gdzie na siatkówce rozmieszczone są światłoczułe komórki, tzw. fotoreceptory. One zamieniają energię fotonów na sygnał elektryczny, który trafia do mózgu i na którego podstawie wytwarzane jest wrażenie postrzegania wzrokowego. Fotoreceptory można podzielić na dwie główne grupy: pręciki odpowiedzialne za widzenie w słabych warunkach oświetleniowych (np. w nocy) i czopki wykorzystywane przy dobrym oświetleniu. Czopki mają trzy rodzaje światłoczułego barwnika, dzięki czemu, o ile tylko jest dostatecznie jasno, możemy rozróżniać barwy. W bardzo dużym uproszczeniu można powiedzieć, że poszczególne czopki są odpowiedzialne za detekcję promieniowania o długościach fali odpowiadających barwom czerwonej, zielonej i niebieskiej, przez co oko ludzkie jest podobne do matrycy światłoczułej z nałożoną mozaiką Bayera.
Czyli można powiedzieć, że oko działa jak przetwornik CMOS/CCD?
Występują pewne analogie, ale są też istotne różnice. Na przykład gęstość rozmieszczenia czopków na powierzchni dna oka jest bardzo nierównomierna. Ich największe zagęszczenie jest w dołku środkowym siatkówki – w okolicy osi optycznej gałki ocznej. W tym obszarze mamy najwyższą zdolność rozróżniania szczegółów, ale występuje ona w bardzo wąskim zakresie, rzędu kilkunastu stopni. Dalej od środka, w obszarze peryferyjnym, widzimy zdecydowanie mniej ostro, dlatego do ostrego widzenia w całym zakresie pola gałki oczne wykonują ruchy skanujące, z których najczęściej nie zdajemy sobie sprawy.
Jak drobne szczegóły jesteśmy w stanie zauważyć gołym okiem?
Najczęściej używa się do tego parametru o nazwie rozdzielczość kątowa oka. Określa ona zdolność oka do rozróżnienia kątowej separacji dwóch osobnych punktów obiektu. Jeśli punkty są w mniejszej odległości, postrzegamy je jako jedną plamę.
Jakiej wielkości są zatem te punkty?
Bardzo dobre pytanie. Pozwala na zwrócenie uwagi, że ten parametr w rzeczywistości nie definiuje żadnego wymiaru liniowego (długości, odległości). Jest to miara kątowa. Można spróbować zdefiniować ją w taki sposób, że odległość kątowa pomiędzy dwoma punktami dla określonej pozycji obserwatora jest miarą kąta, którego wierzchołek znajduje się w pozycji obserwatora, a ramiona przechodzą odpowiednio przez każdy z dwóch punktów. Oznacza to, że zależnie od odległości od obserwowanego obiektu ta sama odległość liniowa między punktami będzie odpowiadała różnym wartościom kątowym. Im bliżej obiektu jesteśmy, tym odległość kątowa między dwoma punktami obserwowanymi na jego powierzchni rośnie i analogicznie wzrasta ich rozróżnialność.
Różne źródła przyjmują różne wartości rozdzielczości kątowej dla zdrowego oka ludzkiego, zazwyczaj około 1-2 minut kątowych.
Dobrym przykładem ilustrującym zjawisko wpływu zdolności rozdzielczej na sposób postrzegania obiektu jest obserwacja reflektorów zbliżającego się pociągu. Kiedy pociąg jest w oddali, wydaje się, że reflektory lokomotywy stanowią jeden punkt. W miarę zbliżania się pociągu punkt rośnie i nabiera trójkątnego kształtu (zakładam, że obserwujemy elektrowóz, który ma dwa reflektory poniżej kabiny maszynisty i trzeci na górze). Gdy pociąg jest jeszcze bliżej, odległość kątowa pomiędzy reflektorami jest na tyle duża, że rozróżniamy poszczególne źródła światła. Oczywiście, obserwację zaleca się wykonywać z bezpiecznego miejsca poza torowiskiem [śmiech]. Można się też przyjrzeć ekranowi telewizora. Im jesteśmy bliżej, tym łatwiej zauważyć, że wyświetlany obraz nie jest ciągły, ale składa się z oddzielnych punktów – pikseli.
Ekran LCD. fot. Kallerna
Powiem rzecz oczywistą, ale niezbędną: na ekranach przeznaczonych do oglądania z większej odległości piksele są większe, a na ekranach do oglądania z bliska – mniejsze. Najwyraźniej jest to skorelowane z rozdzielczością kątową?
Tak. Jeśli chodzi o ekrany przeznaczone do wyświetlania barwnych obrazów wysokiej jakości, to najmniejsze piksele występują w urządzeniach, z których korzystamy trzymając je w dłoni (ok. 30-40 cm od oczu), następnie w monitorach komputerowych (które obserwujemy odległości 50–100 cm), potem w telewizorach (oglądanych zazwyczaj z odległości 2–5 m). Piksele telefonów komórkowych często mają wymiary liniowe poniżej 0,05 mm, a telewizorów między 0,25 a 0,5 mm. W zasadzie można by tu także uwzględnić ekrany wielkopowierzchniowe, np. w salach kinowych, gdzie rozmiary pikseli osiągają wartości milimetrów. Mimo znacznych różnic w fizycznych rozmiarach pikseli różnych typów ekranów, odbiorca korzystający z nich standardowo może odbierać ich szczegółowość na podobnym poziomie. Wszystko przez to, że postrzegany wymiar kątowy piksela zależy nie tylko od jego fizycznej wielkości (wymiaru liniowego), ale także od odległości użytkownika od ekranu. Piksel trzymanego w ręce telefonu komórkowego z perspektywy użytkownika ma podobny wymiar kątowy, jak piksel stojącego na biurku monitora i znajdującego się w odległości kilku metrów telewizora. Oglądając na każdym z nich materiał filmowy w takiej samej rozdzielczości, można nie odczuć znaczącej różnicy jakości odbioru.
Czy dobrze rozumiem, że oglądając film w tej samej rozdzielczości na dużym ekranie w kinie i na małym ekranie w domu mamy tę samą jakość obrazu?
Jeśli chodzi o zapewnienie tej samej szczegółowości, czyli rozdzielczości kątowej obrazu, jest to w dzisiejszych czasach możliwe do uzyskania przy relatywnie niskich nakładach finansowych. Oczywiście, należy wziąć pod uwagę, że wpływ na wrażenia płynące z oglądania filmu ma nie tylko szczegółowość obrazu, ale również wierność odwzorowania barw, kontrastu, jakość dźwięku. Nie wspominając o aspektach społecznych, związanych ze współuczestnictwem w przeżywaniu historii opowiadanej w filmie.
W jakiej odległości od ekranu najlepiej usiąść?
To zależy. Znając rozdzielczość ekranu (na przykład telewizora) i jego wymiary, można wyznaczyć odległość oglądania, przy której dla pożądanego kąta widzenia całego ekranu wymiar kątowy piksela będzie zbliżony do założonej rozdzielczości przestrzennej ludzkiego oka. Wówczas będziemy mieli możliwość maksymalnego „wykorzystania” wszystkich pikseli ekranu. Unikając wchodzenia w bardziej skomplikowane wzory matematyczne, można skorzystać z prostych przeliczników podsuwanych przez producentów telewizorów. Zgodnie z nimi zalecana odległość od ekranu Full HD to „trzykrotna wysokość ekranu” lub „4,2 cm odległości od telewizora na 1 cal przekątnej ekranu”. Wynika stąd, że żeby w pełni docenić rozdzielczość telewizora Full HD o przekątnej 55 cali, najlepiej byłoby usiąść ok. 2,1-2,3 m przed nim (zależnie od przelicznika). Natomiast w przypadku ekranów 4 K proponowana odległość jest o połowę mniejsza (np. dla telewizora o rozdzielczości 4 K i przekątnej ekranu 84 cale zalecana przez producentów odległość oglądania to 1,6 m).
Czy to nie za blisko? Chyba mało kto ogląda program w telewizorze 84-calowym z takiej odległości.
Tak. Ale mowa tutaj przede wszystkim o rozdzielczości granicznej. Nie o psychofizycznym komforcie oglądania. W moim osobistym odczuciu jest to rzeczywiście trochę za blisko. Osobiście nie lubię, gdy ekran zajmuje tak duży obszar pola widzenia. Komfort oglądania filmów odczuwam przy odległości od ekranu równej ok. trzykrotnej lub czterokrotnej jego wysokości. Przy mniejszej odległości szybkie zmiany jasności ekranu powodują zmęczenie wzroku.
Oglądając filmy z takiej komfortowej odległości w rozdzielczości Full HD nie dostrzegasz części szczegółów?
Tak. Nie wspominając nawet o 4 K.
Mój świat chyba legł w gruzach w tej chwili… Czy to oznacza, że w kinie, w którym sprzęt umożliwia projekcję w rozdzielczości 4 K nie oglądamy 4 K?
Oglądamy, oczywiście. Chodzi o to, gdzie siedzimy! Jeśli usiądziemy w optymalnej odległości, obraz będzie pełnowartościowym 4 K. Jeśli jednak sala jest duża, może się okazać, że siedzimy na tyle daleko, że nie ma żadnego znaczenia czy oglądamy na ekranie 4 K czy Full HD. Nasze oko już tego nie będzie rozróżniać.
Dno oka. fot. ConeMosaics / Mark Fairchild
Wróćmy do wielkości pikseli. Idąc za twoim tokiem rozumowania, najmniejsze piksele powinny mieć gogle VR. Tak?
Masz rację. Powinny. Chociaż z goglami – albo lepiej ogólnie – z wyświetlaczami nagłownymi (tzw. headsetami) dla VR różnica jest taka, że w ich przypadku ekrany (osobno dla każdego oka) obserwujemy przez specjalne soczewki, dostosowujące odbieraną (odczuwaną) pozycję ekranu do możliwości akomodacyjnych ludzkiego wzroku. W dużym przybliżeniu można powiedzieć, że użytkownik w headsecie VR ma wrażenie, że każde jego oko widzi z odległości ok. 1 m obraz o wymiarach ok. 1 m x 1 m. Podaję tu wartości zaokrąglone w celu łatwego wyobrażenia sobie pola widzenia. Jeśli wyobrazimy sobie, że fizycznie te dwa obrazy generowane są obok siebie na wbudowanym ekranie o natywnej rozdzielczości Full HD, to pojedyncze piksele są postrzegane, jakby miały w przybliżeniu rozmiar kwadratu o boku 1 mm. Piksele takiej wielkości z odległości 1 m widać bardzo wyraźnie. Z czasem rozdzielczości rosły. Obecnie standardem w headsetach staje się rozdzielczość 1400 x 1600 pikseli na każde oko (gęstość upakowania 25 px/mm). Nadal jednak piksele są w nich z łatwością zauważalne. Natomiast najwyższa rozdzielczość oferowana w znanych mi headsetach dostępnych komercyjnie wynosi 2560 x 1440 pikseli na każde oko. Jednak ze względu na oferowany w nich duży kąt widzenia, nawet tak wysoka rozdzielczość nie zapewnia zbliżenia do granicy postrzegania pikseli przez oko. Być może rozwiązaniem będą headsety, w których dla każdego oka będą zastosowane dwa ekrany – jeden częściowo przezierny o niższej rozdzielczości, pokrywający całe pole widzenia i drugi o mniejszej powierzchni, ale za to o wysokiej rozdzielczości, który byłby pozycjonowany w czasie rzeczywistym na linii osi optycznej gałki ocznej w taki sposób, żeby na obszarze dołka środkowego zawsze formował się obraz o największej szczegółowości. Prowadzi się prace badawcze w tym kierunku, ale na razie ta metoda jest we wczesnej fazie rozwoju..
Gdy korzystam z gogli VR, mam wrażenie, że mimo wszystko ta projekcja z technologicznego punktu widzenia jest nadal słaba. Technologia jeszcze nie jest gotowa na oglądanie filmów wysokiej rozdzielczości w rzeczywistości wirtualnej.
Moim zdaniem jeszcze nie. Odczuwana jakość techniczna oglądanych filmów jest zdecydowanie niższa od tej, którą udostępniają standardowe monitory, telewizory czy projektory kinowe. Ale za kilka lat będziemy na tym etapie.
Pytanie à propos rozdzielczości i wiarygodności projekcji, w sensie odzwierciedlania rzeczywistości: zdarzyło ci się już zastanawiać czy oglądany obraz jest rzeczywisty, czy wyświetlany na monitorze lub ekranie projekcyjnym?
Nie, i nie wydaje mi się, żeby nastąpiło to w ciągu najbliższych kilku lat. Za wytworzenie złudzenia realizmu obserwowanej sceny odpowiada wiele czynników, m. in. poprawny efekt stereoskopowy, głębia ostrości, paralaksa ruchu… Może rozwiązaniem będą wyświetlacze holograficzne? Ale to już temat na inną dyskusję.
Dr inż. Marcin Witkowski – pracownik naukowy Wydziału Mechatroniki Politechniki Warszawskiej. Specjalista w zakresie technik rzeczywistości wirtualnej ze szczególnym uwzględnieniem zastosowań medycznych, ale także VR w rozrywce i wizualizacji dziedzictwa kulturowego.