Взгляд на видео: сжатие H.264




Новейшая технология сжатия видеоизображений H.264 – большой шаг вперед для многих проблемных областей. Применение этого формата позволяет без потери качества изображения получать файлы на 80% меньше, чем при использовании Motion JPEG, и на 50% - чем при использовании стандарта MPEG-4 Part 2. Для передачи и хранения таких файлов требуется значительно меньше ресурсов сети и дискового пространства, что позволяетт либо снизить стоимость систем, либо значительно повысить качество изображения при сохранении прежней скорости передачи битов.

Специалисты полагают, что благодаря таким великолепным показателям, формат H.264 (известный также как MPEG-4 Part 10/AVC – улучшенная система кодирования видео) в ближайшие годы станет наиболее предпочтительным способом сжатия. Эта технология уже используется на новых мобильных телефонах и цифровых видеоплеерах и быстро завоевывает признание пользователей. Поставщики услуг, в том числе владельцы сетей хранения видеофайлов и телекоммуникационные компании, также начинают работать с H.264. Судя по всему, индустрия систем видеонаблюдения не останется в стороне.

H.264 – результат совместной работы организаций, занимающихся разработкой стандартов для телекоммуникаций и информационных технологий. Поэтому у этого формата есть все необходимое, чтобы стать де-факто открытым, лицензированным стандартом сжатия видеоинформации.

Основы сжатия видеоизображения: кодирование и декодирование

Сжатие видеоизображения заключается в удалении избыточных видеоданных или сокращении их объема, благодаря чему файлы с оцифрованным видео удается эффективно передавать по сети и хранить. При сжатии к исходному видеоизображению применяется определенный алгоритм. Применение обратного алгоритма позволяет практически без потерь восстановить оригинальное видеоизображение. Такая пара алгоритмов называется кодеком (кодировщик/декодировщик).

Результаты работы кодировщиков, построенных на одном и том же стандарте сжатия, могут различаться. Это связано с тем, что разработчик программы может по своему выбору реализовать тот или иной набор средств сжатия, предусмотренных стандартом. Это считается допустимым, поскольку итоговый файл имеет установленный стандартом формат и может быть декодирован. Поэтому, не разобравшись сначала в деталях той или иной реализации, невозможно оценить эффективность стандарта по сравнению с другими стандартами и даже с другими его реализациями.

При реализации декодера, напротив, обязательно должны быть реализованы все заявленные в стандарте средства. Это связано с тем, что стандарт четко устанавливает порядок восстановления каждого бита сжатого видеоизображения.


Понятие о кадрах

В зависимости от профиля H.264 (набора алгоритмических функций, предусмотренных стандартом для тех или иных случаев) кодер может работать с кадрами различных типов: I-, P- и B-кадрами.

I–frames (key frames) — кадры, содержащие полное изображение.

P–frames — кадры, содержащие в себе только изменения изображения по отношению к предыдущему кадру.

B–frames — двунаправленные кадры, содержащие в себе изменения как по отношению к предыдущему кадру, так и по отношению к последующему. Как правило этим кадрам предоставляется более низкий поток, нежели I/P–кадрам. Они могут помочь, если требуемое качество видео не умещается в требуемый поток. Такие кадры вставляются между I/P– кадрами.

В сетевых камерах и видеокодерах будет, вероятнее всего, использоваться базовый профиль H.264. Он предусматривает использование только I- и P-кадров и, следовательно, позволяет осуществлять сжатие с минимальной задержкой (затратами времени на сжатие, передачу, восстановление и отображение файла). Последнее очень важно для систем видеонаблюдения, особенно – когда требуется управлять камерой в реальном времени.

Основные методы сжатия данных

Для сжатия видеоданных, как в рамках одного кадра, так и в пределах последовательности, состоящей из нескольких кадров, применяются различные методы. Сжатие в пределах кадра осуществляется обычно за счет удаления избыточной информации. При работе с несколькими кадрами могут применяться такие методы, как дифференциальное кодирование и поблочная компенсация движения.

При дифференцированном кодировании изображение в кадре сравнивается с изображением в опорном кадре (предшествующий I- или P-кадр). При этом кодируются только те пиксели, цвет которых изменился. Следовательно, кодируется и передается меньшее количество пикселей.

Однако, если сжимаемое изображение интенсивно меняется, дифференциальное кодирование не позволяет достичь значительного сжатия. Для таких случаев больше подходит поблочная компенсация движения. В основу это метода положена идея о том, что большинство элементов изображения, составляющих очередной кадр, можно найти на предыдущем кадре, но на других местах. Поэтому кадр разбивается на несколько макроблоков – блоков пикселей. Блок за блоком новый кадр (например, P-кадр) сравнивается с опорным кадром. Если найден совпадающий блок, кодировщик сохраняет только информацию о том, где этот блок расположен на опорном кадре. Для того, чтобы сохранить такой вектор перемещения требуется меньше бит, чем на кодирование содержимого блока.

Повышение эффективности сжатия в H.264

В стандарте H.264 технология сжатия видеоизображения вышла на новый уровень: появилась более совершенная схема внутреннего предсказания, используемая для кодирования I-кадров. Благодаря этой схеме количество битов, необходимых для хранения I-кадра, значительно снижается, а качество изображения остается неизменным. Получить такой результат удается за счет использования моноблоков меньшего размера. Поиск совпадающих пикселей теперь осуществляется среди ранее закодированных пикселей, расположенных по краям нового макроблока. Значения этих пикселей используются повторно. В результате объем, который занимает изображение, значительно уменьшается.

В H.264, кроме того, усовершенствован механизм поблочной компенсации движения, который используется для кодирования P- и B-кадров. Кодировщик H.264 может по своему выбору осуществлять поиск совпадающих блоков (с точностью до суб-пикселя) в произвольном количестве областей одного или нескольких опорных кадров. Размер и форма блока также могут меняться, если при этом совпадение получается более точным. Для построения областей кадра, в которых нет совпадающих блоков, используются моноблоки с внутренним кодированием. Столь гибкий подход к компенсации движения оправдывает себя, например, при наблюдении за людными местами, когда требуется обеспечить также и качество изображения. Для компенсации движения выделяется большая часть ресурсов, отведенных видеокодеру. Поэтому от того, каким образом и насколько полно реализован этот алгоритм, зависит эффективность сжатия видеоизображения кодировщиком H.264.

При использовании H.264 удается также уменьшить количество артефактов блочности, характерных для Motion JPEG и других стандартов MPEG. Для этой цели в цикле кодирования используется внутренний фильтр деблокинга. В результате применения адаптивных алгоритмов удается сгладить края блоков и получить на выходе видеоизображение почти идеального качества.

H.264 набирает ход

Специалисты в области телекоммуникаций и эксперты, занимающиеся информационными технологиями, ожидают, что H.264 постепенно вытеснит другие используемые сегодня стандарты сжатия видеоизображения. В системах видеонаблюдения H.264, скорее всего будет использоваться в первую очередь, для решения задач, требующих больших скоростей передачи данных и высокого разрешения, например, в системах наблюдения за автомагистралями, в аэропортах и казино, где 30 кадров в секунду является нормой. В таких системах применение новой технологии позволит снизить требования к ширине каналов и объемам дискового пространства и приведет к значительной экономии.

Кроме того, ожидается, что H.264 будет способствовать внедрению камер высокого разрешения. Благодаря этой технологии, удастся сократить характерные для работы с этими камерами огромные размеры файлов и трафика, сохранив при этом высокое качество изображения. Однако, есть и отрицательные стороны. Хотя H.264 позволяет снизить стоимость передачи и хранения данных, для работы с ним требуются более сложные сетевые камеры и высокопроизводительные станции наблюдения, где видеоизображение будет декодироваться и просматриваться.

Все больше сетевых камер, видеокодеров и систем управления видеоинформацией поддерживает H.264. Поэтому имеет смысл выбирать именно такие устройства, способные работать с этим новым открытым стандартом сжатия видеоизображения. Другие стандарты, в том числе Motion JPEG, будут применяться в системах с низкими требованиями к частоте кадров, обычно ниже 4 кадров в секунду. Поэтому в идеале, наибольшую гибкость может обеспечить применение устройств, поддерживающих как Motion JPEG, так и H.264.



Создан 14 июл 2011



  Комментарии       
Имя или Email


При указании email на него будут отправляться ответы
Как имя будет использована первая часть email до @
Сам email нигде не отображается!
Зарегистрируйтесь, чтобы писать под своим ником
 
TRASSIR