Почему фильмы и игры при 48/60 кадрах в секунду выглядят странно, а при 24/30 кадрах в секунду — красиво и «кинематографично»? Прежде, чем ответить на этот вопрос, развеем один распространенный миф, что люди не видят более 24 кадров в секунду.

Мы видим больше 24 кадров в секунду

Резко взмахните рукой перед своими глазами — вы отчетливо зарегистрируете только несколько ее положений на всей траектории движения. Конкретно, 24 штуки. Все остальные положения руки превратятся в «мазню» и образуют шлейф, следующий за рукой.

Это та информация, которую видит глаз, но не успевает обрабатывать наш мозг. Так происходит, потому что изображение застывает на сетчатке глаза чуть дольше, чем на 1/24 секунды — это называется инерцией зрения.

А теперь снова взмахните рукой перед глазами, но сфокусируйте взгляд на самой руке — вы видите и отчетливо всю траекторию ее движения. Гораздо больше 24 кадров в секунду.

Но движение ведь не изменилось, верно? Если вы ускорите руку, то снова образуется шлейф — 24 кадра в секунду это минимум, при котором человек не замечает смены кадров. Но не максимум.

Наши глаза постоянно дрожат

Так почему же фильмы и игры при 48/60 кадрах в секунду выглядят странно, а при 24/30 кадрах в секунду — нормально? Движения плавные, красивые и «кинематографичные»?

Ответ один: микротремор глаза. Хоть мы этого и не ощущаем, но наш глаз постоянно дрожит с частотой в диапазоне 70–103 Гц. В среднем эта частота равна 83.68 Гц — наш глаз дрожит в четыре раза быстрее скорости биения сердца птички колибри во время полета.

Это нужно для того, чтобы свет, попадающий в отдельные цветовосприимчивые «колбочки» глаза, полностью освещал каждую отдельную колбочку. Так наш глаз захватывает изображение более чем с двукратным разрешением — больше информации из-за большего количества задействованных колбочек.

Однако изображение при этом остается стабильным!

Прежде, чем свет попадает в колбочки, он проходит сквозь центральную ямку — область глаза, которая захватывает изображение в фокусе. Мозг обрабатывает полученную информацию и «склеивает» кадры, которые видит глаз через эту центральную ямку.

Схематичное строение глаза. Утончение желтого слоя — центральная ямка (fovea)

Близорукие люди давно знают: если прищуриться (или вручную сузить глаза, натянув веки в разные стороны), то изображение станет четче — парадоксально, но при этом оно будет двоиться.

Это происходит из-за пересечения света, воспринимаемого центральной и периферийной частью рецептивного поля. Пересекаются края изображения. Дрожание глаза формирует из этих пересечений след, который мозг трансформирует в изображение.

По сути, он получает в два раза больше информации. Подобная технология используется в некоторых фотокамерах смартфонов.

Рецептивное поле — массив из оптического нервного волокна, «палочек» и «колбочек» глаза.

Когда мы видим изображение с частотой, которая более чем в 2 раза меньше средней частоты колебания глаза (24/30 кадров в секунду), то глаз не воспринимает информацию с должной скоростью, чтобы свет пересекал все колбочки глаза.

Так мозг обрабатывает одну и ту же картинку дважды, а не воспринимает в два раза больше информации. Ограничения «медленного» видеоряда снижают воспринимаемую глазом детализацию и четкость изображения — возникают плавные «кинематографичные» движения и размазанные шлейфы.

Эффект «зловещей долины»

При повышении же частоты раскадровки в ход вступает психологический эффект «зловещей долины»: объект, выглядящий и действующий как человек (но не являющийся им), вызывает неприязнь у людей-наблюдателей.

Несуществующие в реальности объекты (персонажи фильмов, игр) начинают походить на человека. Это вызывает подсознательное отторжение — при условии, что объекты достаточно детализированы. Иначе возникает ситуация, как с «Хоббитом»: красивый современный фильм превратился в постановку Московского ТЮЗа.

Так как отторжение психологическое, то и проявляется оно не у всех людей.

Что насчет 29.997 Гц видео в телевизоре, которое тоже выглядит «странно»? На самом деле, это видеопоток с частотой 59.994 Гц, который из-за чересстрочной развертки экрана отображает лишь половину кадров в 1/60 секунды.

Проблема детализации

Для сохранения реалистичности изображения, его детализация должна увеличиваться соразмерно увеличению раскадровки видеоряда.

С фильмами понятно — нужно улучшать камеры и оборудование, уделять больше внимания пост-обработке изображения.

С видеоиграми ситуация сложнее — они ограничены разрешением 1920×1080 пикселей (основной стандарт современных телевизоров и приставок). Из-за этого вы видите выстроенные «лесенкой» пиксели на очертаниях виртуальных объектов.

Чтобы избавиться от этого недостатка, игры должны воспроизводиться в разрешении 12000×6750 пикселей — недостижимый показатель для компьютерного и приставочного «железа» в несколько ближайших лет.

Как выходить из ситуации? Разработчики игр уже давно знают, как — методы сглаживания изображения скрывают «лесенки», фильтр с цифровым шумом фиктивно увеличивает разрешение картинки, а размытие изображения отвлекает внимание игрока от низкодетализированного окружения.