Автор Тема: ЛИКБЕЗ ПО ВИДЕОСТАНДАРТАМ И МЕТОДАМ ВИДЕОСЖАТИЯ  (Прочитано 6859 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Ozone

  • Гость
Хотел своими словами, но об этом уже столько написано, что не вижу смысла... Возможно, буду что-то от себя добавлять..
Тема назрела сама собой. имхо.

ТИПЫ НОСИТЕЛЕЙ ДЛЯ ЗАПИСИ ВИДЕО
КИНОПЛЕНКА 8мм

Кинопленка ? самый первый носитель и формат для записи видео, который появился в конце 19-го начале 20-го веков. Кинопленка ? это то же самое, что и фотопленка, только в сотни раз длиннее. Естественно, звук на нее записать нельзя, он пишется на другие носители (в отличие от видеокассет).
Профессиональная ?35мм? используется для съемки ?большого кино? и показа фильмов в современных кинотеатрах (даже если Вы идете в суперсовременный кинотеатр с системой DolbyDigital Surround EX, фильм там показывают на кинопроекторе).
?16мм? и ?8мм? - это форматы ?любительские?. Здесь пленка поуже, кадры поменьше, качество картинки хуже.
Несмотря на свою ?древность? кинопленка и по сей день, дает цветовое качество картинки лучше, чем современные аналоговые и цифровые видеокамеры.
VHS

Видеомагнитофоны формата VHS используют обычную кассету с лентой шириной 12.6 мм, наибольшая продолжительность записи на одну кассету - 240 мин при стандартной скорости движения ленты SP (Standard Play) и до 480 мин при замедленной LP (Long Play, с более чем двухкратным ухудшением качества). Главный недостаток VHS-формата: невысокая четкость изображения (около 240 линий по горизонтали) и сильное снижение качества уже при создании первой копии.
S-VHS

По одному проводнику передается информация о яркости, по другому - о цвете изображения. За счет такого разделения информации удается избежать взаимных помех и муара. Телевизоры и видеомагнитофоны с поддержкой S-VHS стандарта используют полноразмерное изображение в PAL или NTSC стандартах, поэтому вы получите более четкое изображение, чем на VHS-телевизоре.
Video8

Модели Video8 используют собственный стандарт компактных видеокассет с лентой шириной 8 мм (от которой формат и получил название). Несомненные плюсы: небольшие габариты самих камер и большая продолжительность записи на одну кассету (до 120 мин. SP и 240 мин. LP). Другие достоинства: приемлемая удельная стоимость съемки, доступная цена самих камер, возможность длительного хранения отснятого материала без перезаписи на специальную дорогую кассету. Многие камеры Video8 обеспечивают запись стереозвука. Недостатки: воспроизведение записей возможно только с самой видеокамеры или дорогого видеоплеера/видеомагнитофона Video8 (обычный VHS-плеер для этого не подходит), четкость изображения не слишком высока (240-250 линий по горизонтали) и уже при создании первой копии качество значительно ухудшается. Камеры Video8 XR (eXtended Resolution - "увеличенное разрешение") обеспечивают меньший уровень помех цветности и яркости, более чистое изображение. Камеры Video8 и Video8 XR ориентированы на любительский рынок.
Hi8

Hi8-камеры используют улучшенный по сравнению с базовым Video8 стандарт записи и кассеты с более качественной лентой (с теми же габаритами и той же шириной ленты). Дополнительный плюс по сравнению с Video8 - очень хорошая четкость записи (380-420 линий). Удельная стоимость съемки выше, чем у Video8, но ниже, чему S-VHS-C. С появлением на рынке новейших Hi8-кассет SONY максимальное время записи достигнет 180 мин. SP (360 мин. LP). Практически все Hi8-камеры обеспечивают запись стереозвука и имеют S-Video-разъем для качественного вывода изображения.
Камеры Hi8 и Hi8 XR ориентированы на любителей с высоким требованием к качеству изображения и звука, не готовых платить за преимущества цифровой техники mini-DV. В российских магазинах Video8 и Hi8-модели представлены в основном продукцией SONY, Canon, Samsung, Sharp, Hitachi.
Digital8 (D8)

Этот формат - не столько шаг вперед, сколько попытка обеспечить более плавный переход видеолюбителей к цифровой технике, считает журнал "Video & Audio" (www.potrebitel.ru). 5 основных особенностей (и достоинств) Digital8: цифровая запись качественного изображения (до 500 линий по горизонтали) и звука, использование кассет Hi8 (допустимо - Video8), воспроизведение аналоговых записей Hi8 и Video8, DV-интерфейс (с возможностью копирования записей на DV-камеры, магнитофоны и ввода в ПК через DV-плату), возможность оцифровки аналоговых записей через аналоговые входы. Модели Digital8 считаются привлекательной покупкой для тех, кто имеет коллекцию записей Video8-Hi8.
MDV (MiniDV)

Модели mini-DV (Digital Video) - семейство малогабаритных камер, использующих очень маленькие кассеты с узкой лентой. Главное их отличие - запись изображения и звука в цифровом виде. Для увеличения плотности записи используется уплотнение со средним коэффициентом 5:1, что позволяет достичь качества, мало уступающего профессиональному Betacam SP. Уровень четкости мало отличается от показателя телевизионного сигнала (около 500 линий по горизонтали).
Один из главных плюсов mini-DV - отсутствие заметных потерь качества при копировании и возможность прямой передачи сигнала на компьютер. Камера mini-DV - дорогая покупка и ориентирована на покупателя с достатком, но с ее помощью можно получить наилучшее качество изображения и звука, доступное любителям. В российских магазинах mini-DV-модели представлены в основном продукцией SONY, JVC, Panasonic, Canon.
Цифровые форматы

Прежде всего, уясним, что такое кодек. Кодек (сoder-decoder) ? это способ и реализация шифрования для записи видеоданных в файл, например в AVI, и расшифровки информации, соответственно, для воспроизведения уже записанных AVI файлов.
Наиболее популярен на сегодня коммерческий кодек DivX. Конкуренцию ему составляет некоммерческий XviD (соответственно, название получилось обратным написанием DivX).
Контейнеры

Во времена широкого распространения Windows 3.1x компанией Microsoft был создан контейнер AVI для хранения синхронных аудио-видео данных. AVI ? это аббревиатура от Audio Video Interleave (чередование аудио и видео). AVI - это расширение файла, которое в принципе можно приписать хоть к картинке. Нас интересует не столько формат файла, сколько его суть, строение.
AVI является формат-контейнером, который может содержать видео/аудио данные, сжатые с использованием разных комбинаций кодеков. Так, если файлы MP3 и JPG получены с использованием только одного вида компрессии данных (MPEG Audio Layer 3 и JPEG), то AVI-файл может содержать различные виды компрессированных данных (например, DivX для видео и MP3 для аудио). Все AVI файлы выглядят одинаково ?снаружи? (имеют расширение .AVI), но ?внутри? они могут существенно отличаться.
С момента создания AVI прошло много времени, и сегодня это наиболее общеизвестный контейнер для представления видео. Росту его популярности во многом способствовало появление DivX.
MKV ? менее популярен, чем AVI контейнер. Свое название он получил при сокращении русского слова ?Matryoshka?, которое в символической форме отображает принципы его работы. Основным преимуществом MKV является его полная открытость. MKV имеет ряд преимуществ перед AVI, однако, по последней информации DivX Networks, являющаяся лидером в разработке и продвижения новых форматов, планирует использовать новый контейнер, который будет построен все же на основе AVI.
MPEG



Ozone

  • Гость
MPEG (Moving Pictures Experts Group) ? это название экспертной группы ISO, которая работает над созданием стандартов кодирования и сжатия видео- и аудио- данных. Стандарты, подготовленные комитетом, получают такое же название.
Первым на рынке появился стандарт MPEG-1. Он был разработан в 1992 году для компрессии видео на CD-ROM и лег в основу Video-CD. Качественные параметры видеоданных, обработанных MPEG-1, во многом аналогичны обычному VHS-видео, поэтому этот формат применяется в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видеоносители. Формат получил большое распространение в Азии и серьезно потеснил VHS-устройства.
Размер картинки: 352х288, битрейт ? 1100 кб/сек
В стандарте MPEG-2 по сравнению с MPEG-1 добавлен многоканальный звук, увеличено разрешение изображения, улучшено качество кодирования. В результате, MPEG-2 получил широкое распространение в спутниковом телевещании и индустрии DVD. Все DVD кодируют в MPEG2.
Размер картинки: 720х576, битрейт ? до 8000кб/сек!
Поистине революционным является MPEG-4, разработка которого была официально завершена в 1998 году. Но так как MPEG-4 ? это, по сути, набор инструментов, то они расширяются и дополняются. MPEG-4 стал расширением MPEG-1 и MPEG-2 и несет в себя много новаторских решений, далеко не все из которых пока нашли применение в устройствах и медиаконтенте.
Формат разрабатывался для передачи видео по сети. На данный момент существуют несколько кодеков, реализующих MPEG4, это Microsoft MPEG4, DivX 3, DivX 4/5, XviD и ещё куча, например RealMedia9, RealMagic, 3ivX.
Стандарт MPEG-4 задумывался как способ передачи потоковых медиаданных, в первую очередь видео, по каналам с низкой пропускной способностью. Неожиданно он завоевал популярность у пользователей, благодаря тому, что позволил размещать полнометражные фильмы длительностью полтора-два часа в хорошем качестве всего на одном компакт-диске и осуществлять обмен видео-файлами в Интернет.
Стандарт MPEG-4 задает принципы работы с цифровым представлением медиаданных для трех областей:
- собственно интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть),
- графических приложений (синтетического контента)
- цифрового телевидения ? DTV.
Фактически формат задает правила организации среды, причем среды объектно-ориентированной. Он имеет дело не просто с потоками и массивами медиаданных, а с медиаобъектами. При одном и том же битрейте и определённых условиях кодирования, качество изображения фильма в MPEG-4 может быть сравнимо или даже лучше, чем в случае применения MPEG-1 или MPEG-2. Алгоритм компрессии видео в MPEG-4 работает по той же схеме, что и в предыдущих форматах. При кодировании исходного изображения кодек сохраняет ключевые кадры, а вместо сохранения промежуточных ? прогнозирует и сохраняет лишь информацию об изменениях в текущем кадре по отношению к предыдущему. Полученная таким образом информация помещается в файл.
Компрессия звука чаще всего производится в формат MP3, Ogg Vorbis, WMA. Однако возможно использование любого кодека, вплоть до применяемого в DVD шестиканального AC-3.
Летом 2003 года DivX Networks объявила о выходе кодека 5.1, который благодаря реализованной технологии оценки визуальных кадров позволяет при меньших битрейтах получать лучшие результаты, чем при использовании предыдущих версий. Этот кодек улучшит качество воспроизведения фильмов на ?слабых? компьютерах и на бытовых устройствах. В 2004 г. ожидается выход версии DivX Q, которая по заявлению разработчиков должна быть вдвое эффективнее текущей 5.1x.
Оборудование для просмотра MPEG4

Безусловным лидером был и остается компьютер. Неудобства, связанные с таким способом просмотра фильмов очевидны. Нельзя удобно расположившись на диване с пультом в руках и наслаждаться просмотром. Нужно ждать загрузки, поле зрения ограничено дисплеем, звук 5.1 доступен далеко не каждому и так далее и тому подобное. Каждый может найти в своей конфигурации множество причин, почему неплохо было бы иметь для себя специализированное устройство.
Напрашивается резонный вопрос: почему бы, например, обычный DVD-проигрыватель, не оснастить возможностью проигрывания DivX?
DivX фильмы не уступают по качеству DVD, но в производстве значительно дешевле и компактны. Многие современные камкордеры и цифровые камеры предлагают возможность создания DivX видео, а также существует огромное количество программ для обработки и записи видео в этом формате.
Мы говорим о широко доступных DVD-плеерах по цене до 250 долл., которые сегодня можно найти на полках магазинов электроники, а в Западной Европе уже и в обычных супермаркетах. Возможность воспроизведения на таких проигрывателях файлов MP3 и JPEG является стандартом.

Битрейт (BITRATE), kbps, mbps - объем информации, переданной в единицу времени, чем выше это значение, тем выше качество видео.

http://www.dfoto.ru/html/html/services/standards.shtml

Ozone

  • Гость
Автор: Слушатель 3 курса (фамилия не известна)
Дата: 16.12.1999

Необходимость алгоритмов и стандартов сжатия видеоданных возникла с появлением цифровых видеосистем. Ведь для качественной оцифровки телевизионного сигнала с граничной частотой 6 МГц необходимо производить как минимум 12 млн. отсчетов в секунду. При восьмибитном кодировании сигнала создается поток 100-120 Мбит/с. Для компьютерных систем это слишком большой поток (особенно, если учесть уровень компьютерной техники 80-х годов).Поэтому сразу же началась разработка стандартов сжатия видеоизображения, без которых в настоящее время немыслимо цифровое видео.
Содержание

    * Введение
    * Представление цвета в формате AVI
    * Основные алгоритмы сжатия формата AVI
    * Основные кодеки формата AVI
    * Сравнение основных кодеков
    * Четырехсимвольный код Micrisoft(FOURCC)

Введение

AVI - Audio Video Interleaved, файловый формат, введенный фирмой Microsoft для использования систем работы с видеоизображениями в среде Windows. В этом формате сектора видео данных чередуются с секторами звуковых данных таким образом, что видеоплеер мог бы поддерживать минимальную буферизацию данных.

Несмотря на то что все большее распространение получает формат MPEG (MPEG стандарты включают MPEG-1, MPEG-2, MPEG-4, и MPEG-7), AVI продолжает оставаться самым популярным для аудио/видео данных на PC. В области ввода и редактирования видео AVI остается стандартом де-факто.

Широкое распространение формат AVI получил после выхода Video for Windows для Windows 3.1 в ноябре 1992 года. AVI является специальным случаем формата RIFF (Resource Interchange File Format). RIFF - универсальный формат для обмена мультимедиа данных, совместно разработанный Microsoft и IBM. Фактически, RIFF - аналог формата IFF, созданного Electronic Arts в 1984 году.

Аудио и видео последовательности в AVI файле не содержат временных меток и не создают индексы. Данные упорядочиваются во времени последовательно, согласно их порядку в AVI файле. Приложение (видеоплеер) должно отображать кадры видеопоследовательности и аудиопоток согласно частоте кадров и частоте дискретизации соответственно, указанных в заголовках файла.

В связи с большим количеством ограничений базового стандарта AVI, консорциумом Open Digital Media было разработано расширение формата AVI - OpenDML AVI с учетом особенностей, требуемых для профессионального производства видео. Данные расширения включают поддержку полей (не только кадров), размеры файлов больше 1 Гб, временной код и многие другие особенности. Microsoft включила поддержку OpenDML AVI в DirectShow 5.1 (ActiveMovie 5.1). Это расширение также используется в различных профессиональных приложениях для производства видео на PC, в частности DigiSuite(Matrox). Начиная со 2 октября 1997г., спецификация OpenDML AVI версии 1.02 (датированная 28 февраля 1996г.) доступна на веб-сайте Matrox Electronic Systems, Ltd. : www.matrox.com/videoweb/odmlff2.htm

Ozone

  • Гость
В стандарте AVI не все несжатые кадры одинаковы. Существуют различные цветовые представления точек изображения. Некоторые из них являются стандартами и поддерживаются во всех системах, другие требуют специальных драйверов. Большинство компонентов Microsoft Windows идентифицируют представление цвета по четырехсимвольному коду (FOURCC), например, 'RGB8' или 'YUY2', другие, например, DIB, не используют четырехсимвольный код для цветовых форматов.
24 БИТ RGB (Стандарт де-факто).

24-разрядный RGB - наиболее известный формат представления цвета, поддерживаемый всеми основными графическими программами. В 24 битах RGB пиксел представлен как три байта, один байт для красного компонента, один байт для зеленого компонента, и один для синего.

Например:
255 0 0 (яркий красный пиксел)
0 255 0 (яркий зеленый пиксел)
0 0 255 (яркий синий пиксел)
0 0 0 (черный пиксел)
255 255 255 (белый пиксел)
128 128 128 (серый пиксел)
и т.д.

Другие цветные форматы:
8 бит полутоновый Y8
9 бит бита YUV9
12 бит BTYUV 4:1:1
12 бит YUV2 4:2:2
8 бит YUV12 16 RGB (использует цветовую палитру)
15 бит RGB (16 бит с значащим разрядным нулем, 5 бит для красного, 5 для зеленого и 5 для синего)
16 бит RGB (16 бит, 5 бит для красного, 6 для зеленого и 5 для синего)
24 бит RGB ? (описанный выше)
32 бит RGB (значащий байт нулевой, 8 бит для красного, 8 для зеленого и 8 для синего)

YUV ? формат представления цвета, используемый в европейском вещании телевизионного стандарта PAL, который был первоначально представлен в Англии и Германии в 1967 году. PAL используется большинством европейских государств и многими странами во всем мире. Соединенные Штаты и Япония используют стандарт NTSC, Франция, Россия и некоторые другие государства - SECAM. Аналоговые видеосистемы, такие как NTSC, PAL и SECAM, передают цветные видеосигналы как сигнал яркости (Y) и два сигнала цветовой разности (U и V). Если, R, G, и B - красные, зеленые, и синие компоненты, то:

Y = 0.299 R + 0.587 G + 0.114 B

U = 0.493 (B - Y)

V = 0.877 (R - Y)

Информация о цвете передается мозгу по трем каналам: каналу яркости, сине-желтому и красно-зеленому каналу. Например, в то время как мы различаем сине-зеленые оттенки, мы никогда не почувствуем оттенок, который является одновременно синим и желтым. Возможно поэтому YUV настолько распространена. Эта система представления цвета используется такими цветными форматами, как YUV9 или YUV2.

Вывод
И неподвижные изображения BMP и AVI файлы могут быть сохранены в различных цветных форматах. В то время как 24 бит RGB поддерживается почти повсеместно, нет никакой гарантии, что ваше программное обеспечение или драйверы воспроизведения AVI поддержат менее известные форматы.

Ozone

  • Гость
Технологии Сжатия Видео

Существуют несколько основных технологий, реализованных в различных кодеках AVI. Например, Indeo 3.2 и Cinepak используют векторную квантизацию, международные стандарты MPEG-1, MPEG-2, MPEG-4, H.261 и H.263 - комбинацию дискретного косинус- преобразования и компенсацию движения. Некоторые из кодеков последнего поколения основаны на дискретном преобразовании элементарной волны (Discrete Wavelet Transform or DWT ). Другие технологии включают алгоритм рекурсивного сжатия изображения, разработанный кампанией Iterated Systems.

1. СЖАТИЕ БЕЗ ПОТЕРЬ

Изображение, полученное после декодирования, полностью совпадает с первоначальным.

2. СЖАТИЕ С ПОТЕРЯМИ

Часть информации теряется в процессе сжатия. Принцип сжатия с потерями основан на ограниченных возможностях человеческого зрения.

СЖАТИЕ С ПРОЦЕНТНЫМИ ПОТЕРЯМИ

Все потери информации лежат в границах, когда человеческий глаз не видит разницу между первоначальным изображением и декомпрессированным сжатым изображением, содержащим ошибки сжатия с потерями.

СЖАТИЕ С ЕСТЕСТВЕННЫМИ ПОТЕРЯМИ

При использовании JPEG, MPEG и других форматов компрессии видео с потерями изображение часто повреждается больше, чем при сжатии с процентными потерями, однако, видео все еще остается приемлемым для человеческого восприятия. Если сжатие и декомпрессия в процессе преобразования повреждают изображение, аналогично естественным повреждениям, то зрение не будет сильно ?протестовать?.

Потеря большой детализации в изображении часто приемлема, потому что люди воспринимают объекты в естественном мире с различными уровнями детализации, в зависимости от расстояния до объекта и угла зрения. Люди также привыкли к некоторым естественным помехам, как, например, дождь и туман. Человеческий глаз различает острые грани и линии в изображении, независимо от уровня детализации. Таким образом, человек воспринимает объекты, несмотря на изменения в уровне детализации.

СЖАТИЕ С НЕЕСТЕСТВЕННЫМИ ПОТЕРЯМИ

Достаточно низкое качество сжатия с потерями проявляется в визуальных артефактах, которые резко бросаются в глаза. Примером являются блочные артефакты, видимые в сильно сжатом MPEG видео, и других декодерах, основанных на дискретном косинус - преобразовании изображения.

В некоторый момент алгоритм сжатия выдает неестественные артефакты, воспринимаемые как новые объекты в сцене. Человеческий глаз очень чувствителен к линиям и граням. Одна из его основных функций - распознавать физические объекты, такие как другие люди, потенциальные угрозы и т.д. Объекты для человека ограничены гранями. Следовательно, действие алгоритма сжатия, уничтожающего или создающего кромку изображения, особенно заметно, если человеческий глаз не воспринимает ее как границу объекта.

Все широко используемые кодеки видео являются алгоритмами сжатия с потерями. При достаточно высоком уровне сжатия возникают проблемы с отображением граней. Сжатие на основе векторной квантизации, дискретного косинус - преобразования и преобразования элементарной волны работают с растровым изображением, в котором отсутствует понятия края и линии.

Последовательное кодирование длины (ПКД) Кодек, использующий последовательное кодирование длины - Microsoft RLE (MRLE)

ПКД также используется, для кодирования коэффициентов DCT в блоках дискретного косинус - преобразования, которые входят в реализацию форматов MPEG, H.261, H.263, и JPEG.

Особенности:

   1. Хорошо подходит для черно-белых или 8 разрядных графических изображений, таких как кадры анимации.
   2. Не подходит для естественных изображений с высоким разрешением.

КРАТКОЕ ОПИСАНИЕ

ПКД кодирует последовательность пикселей одинакового цвета (например, черного или белого) как одиночное ключевое слово. Так, например, последовательность пикселей:

77 77 77 77 77 77 77

может быть закодирована как

7 77 (семь 77).

ПКД хорошо работает с изображениями двоичного уровня (например, черно-белый текст или графика) и 8 битными образами, особенно кадрами мультипликации, содержащими большие последовательности одинакового цвета.

ПКД практически не работает с 24 разрядными естественными изображениями, поскольку в подобных изображениях последовательности пикселей одного цвета практически отсутствуют.

Векторная квантизация Кодеки, использующие векторную квантизацию: Indeo 3.2, Cinepak.

Indeo и Cinepak работают с YUV представлением цвета.

Особенности:

   1. Процесс кодирования в вычислительном отношении интенсивен и не может быть выполнен в реальном времени без специализированных аппаратных средств
   2. Быстрый процесс декодирования
   3. Появление блочных артефактов при высоком сжатии

Ozone

  • Гость
КРАТКОЕ ОПИСАНИЕ

При векторной квантизации изображение делится на блоки (4x4 пикселя для Indeo и Cinepak). Как правило, некоторые блоки подобны другим блокам, хотя обычно, они не идентичны. Кодер идентифицирует класс подобных блоков и заменяет их на "универсальный" блочный представитель, составляет поисковую таблицу коротких двоичных кодов к "универсальным" блокам. Как правило, самые короткие двоичные коды представляют наиболее общие классы блоков в изображении. При векторной квантизации (VQ) декодер использует поисковую таблицу, чтобы транслировать приблизительное изображение, составленное из "универсальных" блоков согласно поисковой таблице.

Потери при сжатии неизбежны, поскольку фактические блоки заменены универсальным, который является "достаточно хорошим" приближением к первоначальному блоку. Процесс кодирования медленен и в вычислительном отношении интенсивен, потому что кодер должен накопить статистику по частоте блоков и формировать классы подобных блоков для поисковой таблицы. Процесс декодирования очень быстрый, поскольку основывается на уже созданной поисковой таблице. В векторной квантизации поисковая таблица называется книгой ключей, а индексирующие таблицу двоичные коды - ключевыми словами. Более высокое сжатие достижимо при уменьшении поисковой таблицы. При этом качество изображения ухудшается (появляются блочные артефакты), т.к. поисковая таблица уменьшается.

Дискретное косинус преобразование (ДКП) Кодеки, использующие дискретное косинус преобразование:

    * Motion JPEG
    * Editable MPEG
    * MPEG-1
    * MPEG-2
    * MPEG-4
    * H.261
    * H.263
    * H.263+

Особенности:

   1. Появление блочных артефактов при высоком сжатии
   2. Излом острых граней. Случайное размытие в острых граней
   3. Большие требования к вычислительным мощностям

КРАТКОЕ ОПИСАНИЕ

ДКП - широко используемое преобразование при сжатии изображения. Двумерное ДКП применяется к блокам 8*8 пикселей.

Человеческий глаз менее чувствителен к высоким компонентам частоты изображения, представленного более высокими коэффициентами ДКП. Больший коэффициент квантования обычно применяется к этим более высоким компонентам частоты. Фактическая стандартная матрица квантования (матрица 64 коэффициентов квантования, один для каждого из 64 коэффициентов ДКП) в JPEG стандарте имеет более высокие коэффициенты квантования для более высокой частоты коэффициенты ДКП. Квантуемые коэффициенты ДКП- тогда выполняемая длина, закодированная как коды переменной длины, которые указывают некоторое число нулевых коэффициентов, сопровождаемых ненулевым коэффициентом. Например, код выполняемой - длины мог бы указывать 4 нулевых коэффициента, сопровождаемые ненулевым коэффициентом уровня 2. Короткие коды переменной длины (например 0110) используются для общих комбинаций, последовательностей из нулей и уровней ненулевого коэффициента. Более длинные коды переменной длины (например 0000001101) используются для менее общих комбинаций, последовательностей из нулей и уровней ненулевого коэффициента. Таким образом, существенное сжатие изображения возможно. ДКП матрица NxN, строки которой - функции косинуса:



где



N - число выборок в блоке

Дискретное преобразование элементарной волны (DWT- Discrete Wavelet Transform)
Кодеки, использующие DWT:

    * VDOWAVE VDONET'S
    * VxTreme
    * Intel Indeo 5.x
    * Intel Indeo 4.x

Особенности:

   1. В отличие от ДКП, большинство DWT кодеков осуществляют преобразование без блочных артефактов
   2. Алгоритмы сжатия, основанные на DWT, часто превосходят по быстродействию ДКП
   3. Субъективное качество видеоизображений, сжатых с DWT, может быть лучше, чем при ДКП с таким же коэффициентом сжатия
   4. По мере увеличения сжатия на острых гранях появляются размывающие и окружающие артефакты. Этот недостаток является общим с ДКП

Ozone

  • Гость
КРАТКОЕ ОПИСАНИЕ

DWT по существу состоит из прохождения сигнала через два фильтра - ФВЧ и ФНЧ. Перед вводом на фильтры, сигнал разбивается на два одинаковых. Далее эти сигналы уменьшаются вдвое. Параметры фильтров выбраны так, чтобы при сложении сигналов с ФНЧ и ФВЧ воспроизводился первоначальный сигнал. Вывод ФВЧ или ФНЧ, может тогда быть подан в другую пару фильтров для повторного процесса.
Простым примером DWT является Haar преобразование элементарной волны:

Входной сигнал - x [n] (ряд выборок, индексированных по n).

Haar НПФ (среднее число двух последовательных выборок):



Haar ВПФ (различие двух последовательных выборок):



Заметим, что:





Последовательности вывода g [n] и h [n] содержат избыточную информацию. Их можно разложить на две последовательности, опустив четные или нечетные члены, после чего все еще возможно воспроизведение первоначального входного сигнала x[n]. Обычно опускаются нечетные выборки. Входной сигнал x [n] может быть воспроизведен полностью по



и т.д.

Вывод ФНЧ - грубое приближение первоначального входного сигнала. Если входной сигнал - изображение, то на выходе фильтра получается изображение с низкой разрешающей способностью. Вывод ФВЧ - добавление деталей (при работе с изображением).

Грубое приближение иногда называется основным уровнем, а добавление деталей - уровнем расширения. Вывод ФВЧ h [n], может подаваться на другую пару фильтров.

При сжатии видеоизображения, DWT может повторяться несколько раз. Алгоритм производит такое же число бит, что и подается на его вход. Результаты на выходе называются коэффициентами преобразования.

Haar преобразование элементарной волны используется, прежде всего, для иллюстративных целей. На практике применяются более сложные фильтры.

Алгоритмы, основанные на DWT, позволяют добиться лучших результатов, чем ДКП. В последнее время, DWT становится все более популярным.

Контур - основанное кодирование изображения.

Примером контура - основанного кодирования изображения может служить Crystal Net's Surface Fitting Method (SFM). Стандарт MPEG-4 также включает некоторые идеи, связанные с контур - основанным кодированием изображения.

КРАТКОЕ ОПИСАНИЕ

Контур - линия, ограничивающая объект. Текстура - представление структуры поверхности. Контур - основанное кодирование изображения представляет изображения как контуры, ограничивающие текстурируемые области.

Поскольку контуры часто соответствуют границам объектов в сцене, имеются близкие отношения между контур - основанным кодированием изображения и основанным на объектах (представляет изображение как совокупность объектов).

Например, как только текстуры и контуры извлекаются из изображения, последние могут быть закодированы как контрольные точки сплайна (полиномиальная функция представления кривых). Текстуры, в свою очередь, могут быть закодированы с использованием ДКП или DWT.

Контур - основанное кодирование - одна из новейших технологий сжатия изображений (май 1999г.). Выявление контуров остается нерешенной задачей.

Достигая более высокого сжатия, контур - основанное кодирование изображения может обходить проблемы, с которыми сталкиваются ДКП (JPEG, MPEG, H.261, H.263, DV, и т.д.) и DWT (Intel Indeo, VDONet VDOWave, и т.д.).

Кодирование разности кадров
Кодек, использующий кодирование разности кадров - Cinepak.
Особенности:

Может достигать лучшего сжатия, чем независимое кодирование отдельных кадров.
Ошибки накапливаются в кадрах после ключевого кадра, в конечном счете, требуя следующий ключевой кадр. (см. ниже)
КРАТКОЕ ОПИСАНИЕ

Обычно изменения между соседними кадрами незначительны (например, в случае шара, летящего перед статическим фоном, большая часть изображения не меняется между кадрами). На этом основан алгоритм кодирования разности кадров.

Разности кадров кодируются при помощи алгоритмов сжатия неподвижных изображений (DWT, ДКП). Ключевые кадры сжимаются независимо от предыдущих, что ограничивает накопленные ошибки и делает возможным поиск в пределах потока видео. Например, в широко используемом кодеке Cinepak ключевой кадр устанавливается каждые 15 кадров.

Компенсация движения (КД)

Кодеки, использующие КД:

    * ClearVideo (RealVideo) Fractal Video Codec от Iterated Systems
    * VDOWave от VDONet
    * VxTreme
    * MPEG-1,2, и 4
    * H.261
    * H.263
    * H.263+

Особенности:
Сжатия видео выше, чем при кодировании разности кадров.
Стадия кодирования алгоритма КД в вычислительном отношении интенсивна.
Схема КД, используемая в международных стандартах MPEG, H.261, и H.263 работает лучше всего для сцен с ограниченным движением.

Ozone

  • Гость
КРАТКОЕ ОПИСАНИЕ

Стандарты MPEG-1, MPEG-2, MPEG-4, H.261 и H.263, основанные на ДКП, используют КД, Iterated Systems ClearVideo (Real Video), VDOWave и VxTreme's - различные формы КД. Метод КД, используемый в MPEG, H.261 и H.263, работает только для переводного движения, т.е. для объектов, перемещающихся поперек фона или панорамирования камеры, но практически не работает для вращения объектов, изменения их размеров или увеличения камеры (см. ниже). Существуют и альтернативные формы КД, обрабатывающие вращательное движение, масштабирование, искажение и другие виды движения в сцене.

Распознавание объектов - нерешенная проблема в обработке изображения. При сжатии, изображение делится на блоки (16x16 пикселей в MPEG-1). Для каждого блока кодируется вектор движения, указывающий на блок в предыдущем или следующем кадре, который схож с кодируемым блоком. Блок ссылки может совпадать с исходным (отсутствие движения) или отличаться от него (движение). Кодеку не требуется распознавать присутствие шара или другого объекта. Он лишь сравнивает блоки пикселей в декодированном кадре и кадре ссылки.

Сжатие достигается путем пересылки или сохранения только вектора движения вместо значений пикселей для полного блока. Кодированные ("предсказанные") блоки формируют декодируемый кадр. Блоком ссылки может быть любой 16x16 блок пикселей в кадре ссылки, который больше всего схож с кодированным блоком. Кадр ссылки должен быть декодирован до начала декодирования текущего кадра. Однако, кадр ссылки не обязательно должен идти перед текущим декодируемым кадром. Фактически, кадром ссылки может быть будущий кадр. MPEG учитывает это через так называемый B (двунаправленный предсказанный) кадр.

В большинстве блоков, как в примере с шаром на статическом фоне, движение отсутствует. Для этих случаев, векторы движения - нулевые.

Для блока или блоков, содержащих перемещающийся шар, векторы движения будут не нулевыми, указывая на блок в предыдущем (или будущем) кадре, который содержит шар. Перемещенный блок вычитается из текущего блока. Вообще, там будут оставлены некоторые ненулевые значения которые будут закодированы, используя ДКП, или DWT. В MPEG, векторы движения закодированы как коды переменной длины для большего сжатия. Процесс кодирования в данном случае называется Оценкой Движения.

Пример:



Четыре блока со связанными векторами движения (4, -4, 0, и 0). Верхний левый блок напоминает верхний правый блок в области ссылки (где шар был). Верхний правый блок напоминает верхнюю левую область в области ссылки. Более низкие левые и более низкие правые блоки были неизменны. В этом простом примере, вертикальное смещение нулевое и игнорируется. В этом простом примере, область может быть декодирована, используя один векторы движения. В большем количестве общих случаев, имеется ошибка между предсказанным кадром и текущим кадром. Эта ошибка кодирована, используя все еще схему сжатия изображения(образа) типа блока ДКП.

В этом простом примере, предварительно декодированный кадр также является предыдущим в представленном порядке. Предварительно декодированный или кадр ссылки предшествует текущему кадру по времени. Вообще, имеются различие между декодированным порядком и представленным и порядком. Кадр ссылки может быть и будущим кадром.

Ozone

  • Гость
Основные кодеки формата AVI

Microsoft Run Length Encoding.
Microsoft RLE поддерживает только 8 разрядов цвета, максимум 256 цветов. Использует алгоритм последовательного кодирования длины.

Cinepak
Один из старейших кодеков, появившихся на рынке. Первоначально был разработан фирмой SuperMac. Однако, впоследствии был переработан другой фирмой ? Radius. Свою популярность кодек получил благодаря использованию минимальных ресурсов процессора. Максимальный коэффициент компрессии составляет 10:1. Кодек выдает среднее качество видеоизображения из-за чрезмерной пикселеризации (изображение выглядит ?шероховатым?). К недостаткам кодека также относится изменение насыщенности цвета в видеоизображении, что влечет за собой определенный визуальный эффект ? изображение становится более желтым. Cinepak ? наиболее асимметричный кодек. Кодирует видеоизображение в 8- и 24-битном разрешении цвета. Алгоритм сжатия использует векторную квантизацию (vector quantization) и межкадровую разность. Плохо работает с видеоизображением, частота воспроизведения которого превышает 15 кадров в секунду. Кодек хорошо сжимает синтезированное динамическое видеоизображения ? 2D и 3D анимацию. В случае черно-белого видеоизображения, кодек представляет возможность произвести сжатие в 8-битном режиме с 256 оттенками серого.

В настоящее время корпорация Compression Technologies продает улучшенный кодек CinepakPro, в котором усранены основные проблемы которые встречались у стандартного Cinepak. CinepakPro полностью совместим с Cinepak.

Motion JPEG Большинство систем захвата и редактирования видео на PC используют стандарт сжатия видео Motion JPEG. В Motion JPEG, каждый кадр видео сжимается отдельно, используя алгоритм JPEG сжатия неподвижных изображений. Алгоритмы, аналогичные разности кадров или компенсации движения не используются. Это позволяет производить точное редактирование кадров без потери качества изображения при возможном редактировании.

Ситуация в отношении стандарта для Motion JPEG усложнена тем, что отсутствует промышленный стандарт для Motion JPEG. Microsoft имеет Microsoft Motion JPEG кодек и JPEG DIB. Расширения OpenDML Avi формата AVI также включают поддержку Motion JPEG. Motion JPEG обычно использует четырехсимвольный код 'MJPG'.

Motion JPEG используется при редактировании и создании видео, но редко для его распространения.

Editable MPEG
По крайней мере две компании определили стандарт Editable MPEG в AVI файлах. Xing Technology editable MPEG AVI использует четырехсимвольный код XMPG. Компания Sigma Design определяет его, используя четырехсимвольный код MPGI. Данный стандарт соответствует стандарту MPEG, за исключением компенсации движения. Во многом он похож на Motion JPEG.

VDOWave или VDOLIVE от VDONET
Основанный на преобразовании элементарной волны кодек видео. Microsoft лицензировал VDOWAVE как часть NetShow. Имеются две версии VDOWAVE кодер-декодера. VDOWave 2.0 - кодек фиксированной задержки пакетов в канале , который использует Microsoft, четырехсимвольный код VDOM.. VDOWave 3.0 - "масштабируемый" кодек видео. Этот кодек использует Microsoft четырехсимвольный код (FOURCC) VDOW. В NetShow 2.0, автономная установка клиентов устанавливает VDOWAVE декодер. VDOWave использует комбинацию алгоритмов сжатия элементарной волны и компенсации движения.

Intel Indeo 3.1/3.2
Один из старейших кодеков, появившихся на рынке. Качество сжатого видеоизображения немного лучше, чем у Cinepak. Однако, кодек более требователен к ресурсам процессора. Indeo 3.1/3.2 представляет собой менее асимметричный кодек ? время компрессии и декомпрессии видеоизображения примерно равны. Максимальный коэффициент компрессии составляет 15:1. Кодирует видеоизображение в 24-битном разрешении цвета. Алгоритм сжатия использует векторную квантизацию и межкадровую разность. Кодек наиболее подходит для сжатия изображения с ?говорящими головами?. Процесс сжатия видеоизображения на порядок быстрее, чем у Cinepak. Видеоизображение, сжатое при помощи кодека Indeo R3.2, имеет цветовые артефакты ? изображение расплывается и получает красно-синий оттенок.

Indeo 4.1
Indeo Indeo Video Interactive, Indeo 4.1, является следующей принципиально новой версией кодека от Intel, основанной на гибридном алгоритме DWT. Indeo 4.1 поддерживает множество особенностей в дополнение к новому алгоритму сжатия, например прозрачность. При низкой скорости передачи данных при применении алгоритмов , использующих дискретное преобразование элементарной волны (DWT), проявляется размытие в гранях объектов и также артефакты "окружения" около граней, но нет блочных артефактов, явно видимых при ДКП.

Indeo Video Interactive 5.x
В настоящее время Intel распространяет Indeo 5.10 co своего веб- сайта: http://developer.intel.com/ial/indeo/video/.

Indeo 5.1 использует новый улучшенный алгоритм DWT для увеличения качества видео. Indeo 5.х включает такие особенности как прогрессивная загрузки для Internet, прозрачность, спрайты, и т.д.

Хронология выпуска Indeo Видео 5.x:
# Intel Indeo 5.10 (02 февраля 1999г.)

# Intel Indeo 5.06 (1998г.)

# Intel Indeo 5.0 (1997)


Все выпуски Indeo 5.x, используют четырехсимвольный код IV50.

ClearVideo ( RealVideo)
ClearVideo - кодек видео от Iterated Systems. Компания Iterated Systems также лицензировала технологию ClearVideo технологию Progressive Networks, изготовителю RealAudio, под названием RealVideo. ClearVideo использует рекурсивное сжатие. Рекурсивное кодирование видео достаточно медленное (требовательно к вычислительным ресурсам). Качество видео аналогично или несколько выше MPEG-1.

SFM (Surface Fitting Method)
Корпорация Crystal Net стремится лицензировать технологию SFM. Этот кодек рассчитан на использование при большой задержке пакетов в канале для IDSN и коммутируемого соединения. SFM использует алгоритм контур-основанного кодирования изображения.

QPEG
Q-group производит avi кодек известный как QPEG. На 6/27/97, QPEG поддерживал 8 разрядов цвета. Известно, что Q-группа планирует поддержку 16 и 24 разряда цвета, MMX поддержку, и другие дополнительные особенности в будущем. Q-группа также работает НАД MPEG-4 для PC.

H.261
H.261 - рекомендация, разработанная и оптимизированная для передачи цветного видеоизображения по каналам данных системы IDSN со скоростями px64 Кбит/с и фиксированными значениями задержек пакетов в канале. В H.261 реализована комбинация алгоритмов ДКП и компенсации движения. В алгоритме применяется формат CIF (Common Intermediate format) c разрешением 352х288 пикселей для яркостного сигнала или QCIF (Quarter CIF) с четвертной частью разрешения CIF (то есть 176х144). Скорость кадровой развертки равна 29.97 кадра в секунду. Необходимо отметить, что при использовании формата CIF, цветоразностные сигналы передаются с разрешением 176х144 пиксела, каждый пиксел описывается восемью битами.

H.263
H.263 - стандарт, основанный на ДКП и компенсации движения. H.263 имеет множество усовершенствований, главным образом в области компенсации движения, по сравнению с более раним стандартом H.261. Это позволяет добиться еще более высокого сжатия видео.

MPEG-4
MPEG-4 - новый международный стандарт от Международной Организации Стандартизации. Алгоритм MPEG-4 близок к рекомендации H.263. Имеются три версии MPEG-4 для Windows от Microsoft. Самой современной, от 25 октября, 1999 г., является Microsoft MPEG-4 Версия 3. Аудиовизуальный сигнал в MPEG-4 можно передавать в реальном времени потоком не более 48-64 кбит/с.

Lightning Strike (Infinop)
Infinop предлагает основанный на алгоритме преобразования элементарной волны кодек видео под названием Lightning Strike (удар молнии). Декодер Lightning Strike, совместимый с Microsoft NetShow доступен на Веб сайте Infinop. Насколько известно, кодер Lightning Strike не распространяется свободно.

VxTreme
VxTreme был приобретен Microsoft в сентябре 1997. Microsoft вложил капитал в несколько компаний, занимающихся разработкой кодеков с большими значениями задержек пакетов в канале в течение второй половины 1997, таких как VxTreme, VDONet, Progressive Networks/Real Networks, и Lernout и Hauspie Speech Products. VxTreme использует алгоритм сжатия, основанный на преобразовании элементарной волны. Субъективное качество изображения сжатого VxTreme достаточно хорошее, намного выше кодеков, основанных на ДКП и VDOWAVE. Текст типа заголовков кинофильма и титров кодирует очень хорошо, в отличие от ДКП, где основной проблемой является сохранение острых граней текста. Вообще, wavelet сжатие изображения сталкивается с проблемами острых граней тоже. По качеству изображения VxTreme не сильно отличается от MPEG-4 или H.261.

Ozone

  • Гость
Четырехсимвольный код Micrisoft(FOURCC)

Четырехсимвольный код или FOURCC - код в четыре байта, определенный Microsoft как часть Видео для Windows, чтобы идентифицировать различные типы данных видео. Microsoft определил FOURCC'S, для уникальной идентификации представления пиксела и типа видео кодека в Видео для Windows. Например, FOURCC 'CVID' идентифицирует Cinepak (прежде Compact Video) видео кодек. AVI файлы содержат FOURCC для видео кодека в заголовке потока видео. В дополнение к кодекам, четырехсимвольный код идентифицирует представление пиксела, используемые в несжатых изображениях и видео. Например, коды 'YUY2' идентифицируют представление пикселей в YUV модели представления цвета. Эти коды используются в связи с помощью интерфейса с графическими платами. Video for Vindows, DCI, и Direct Draw все используют FOURCC.


http://codecs.org.ua/article/articles_video/avi_standarts.html

Ozone

  • Гость
Цифровой нелинейный монтаж на РС в домашнем и корпоративном видео

В настоящее время все большую популярность набирает цифровая обработка видео на персональном компьютере. Этому способствует несколько основных причин. Первая необыкновенно возросшая мощь процессоров и снижение их стоимости. В первую очередь это касается процессоров Intel и ОС фирмы Microsoft. Можно по-разному относится к этим двум гигантам, но следует признать что по сочетанию доступности, стоимости и возможностям комбинация Intel&Microsoft наиболее оптимальна при использовании РС в качестве ПЕРСОНАЛЬНОГО компьютера.

Следующий основной фактор, это практическое воплощение разработок в области сжатия изображения вообще и движущегося в частности. Массовый выпуск сравнительно дешевых чипов для аппаратной реализации компрессии/декомпрессии и появление дешевых ЦАП и АЦП, по-зволил создавать сравнительно доступные (правда к сожалению не по нашим меркам :-( ) платы позволяющие создавать на базе обычного РС достаточно мощную видео-монтажную станцию, по своим возможностям не уступающую небольшой классической ТВ студии. Не смотря на множество реализаций аппаратных кодеков для видео, в основном используется два вида очень схожих между собой метода компрессии. Это метод M-JPEC, основанный на графическом формате JPEG, и MPEG (в разных вариациях). Оба метода основаны на дискретно-косинусном преобразовании (DCT) изображения разбитого на блоки. Не вдаваясь в подробности можно отметить, что разница этих методов заключается в исключении избыточной информации из исходного видеоизображения. Если M-JPEG использует только внутрикадровую избыточность (так называемую пространственную), то формат MPEG дополнительно использует и межкадровую избыточность (временную).

Очень коротко это можно описать так. Видеосигнал оцифровывается аналого-цифровым преобразователем и помещается в кадровый буфер. Оцифрованный кадр разбивается на небольшие блоки (обычно 8Х8 пиксель). После этого производится обработка полученных блоков по алгоритму дискретно-косинусного преобразования (DCT). В результате этой обработки происходит усреднение одинако-вых участков изображения, и как следствие этого размер кадра уменьшается (исходный размер одного кадра для ТВ сигнала системы PAL составляет чуть более 1Мб в формате TGA). Однако за счет разбиения на блоки, исходное изображение теряет четкость.

На практике стараются поддерживать определенное качественное соотношение между исходным и полученным кадром исходя из необходимости сохранения качества исходного изображения и ограничения цифрового потока видеоданных. Это соотношение носит название коэффициента компрессии. На практике применяются коэффициенты от 1:1 (без сжатия) до 20:1 (сжатие исходного кадра в 20 раз). Это соответствует каче-ству ТВ сигнала от эталона (1:1) до бытового VHS (20:1). В формате MPEG к внутри-кадровому сжатию прибавляется межкадровое. Анализируются предыдущий и последующий кадры. Результатом этого анализа является вычисление разности между предыдущим и последующим кадром и формировании разностного кадра. Алгоритм MPEG значительно сложнее, поскольку здесь приходится анализировать не один кадр а сразу большую последовательность кадров. Если для видеосигнала уже записанного на диск, проблемы не существует (компьютер может обрабатывать видеоданные записанные в файл постепенно), то при записи в "живую" необходимо использовать алгоритмы предсказания следующей последовательности кадров, для более оптимального сжатия.

M-JPEG есть видео разновидность JPEG, но работающая с чересстрочной разверткой. При полноразмерных кадрах движения всегда получаются плавные и контуры движущихся предметов не имеют зазубрин. MPEG1 не умеет делать чересстрочную развертку и выдает одно поле на кадр. Именно поэтому использовать его при размерах кадра по вертикали более числа строк в поле видеосигнала нельзя. Если два поля объединяются в одно, то получаются зазубрины на вертикальных границах контуров быстро перемещающихся объектов сцены. Если этого не делать, то нет смысла увеличивать размер кадра при оцифровке и хранении видео. Да и при прямом сравнении MJPEG и MPEG1 видео на экране телевизора разница в 50 и 25 полей в секунду весьма заметна.

Механизм детектирования движения при кодировании MPEG иногда дает неприятные рывки картинки на сценах типа съемки камерой с поворотом вокруг вертикали (панорама площади в городе). Для их устранения приходится сокращать интервал между ключевыми кадрами MPEG.

Профессиональные кодеры часто вообще используют Editable MPEG, в котором все кадры ключевые. При этом разница между MPEG и MJPEG есть только в деталях реализации алгоритма DCT.

При одинаковых скоростях потока данных и размерах кадра MJPEG и Editable MPEG1 (только Intraframe компрессия) качество у MJPEG визуально лучше. Я сравнивал разные программные MPEG1 недорогие кодеры с аппаратным Mjpeg от Matrox (на деле Zoran chip) или программным от Morgan Multimedia. Качество у MJPEG выше.

MJPEG применяется во всех профессиональных и бытовых цифровых камкордерах. Отличие профессиональной техники от бытовой не в кодеке (алгоритме сжатия), а в качестве линз, CCD приемников и прочих чисто железных деталях.

Кодек MPEG2 от Sony ничего сложного на деле не представляет - используется фиксированный тип последовательности кадров типа ключевой плюс один с двунаправленным предсказанием IBIBIBI..., а не какой-нибудь действительно интеллектуальный алгоритм кодирования типа переменного интервала между ключевыми кадрами, автоматического детектирования сцен с быстрыи изменениями и настройки алгоритма компрессии на именно такую скорость смены содержания кадров. Такие тоже есть, но ориентированы на кодирование MPEG1 для CD, когда экономия на каждом байте в секунду за счет умного кодера действительно нужна для улучшения и так неважного качества. (см. подробнее здесь) MPEG2, конечно, допускает большие размеры кадров и чередование полей. Но это точно не для CD video.

Следует заметить что декодирование данных сжатых по обеим форматам не представляет особой сложности. Ограничение использования формата MPEG в кодеках Hi-END уровня объясняется тем, что при сжатии часть кадров меняется настолько, что невозможно восстановить все кадры в полном объеме. Понятно что возможности монтажа в формате MPEG очень ограничены. Преимущества формата MPEG проявляется при сжатии готового видеофрагмента (без необходимости монтажа). Устраняя временную избыточность MPEG позволяет получить отличное качество изображения при коэффициенте компрессии существенно более высоком чем при использование формата M-JPEG. Этим объясняется использование данного алгоритма при записи видео на CD, DVD и передачи цифрового видео по каналам связи. (Для сравнения ширина канала для передачи через спутниковый трансподер составляет 27 МГц для ЧМ модуляции аналогового ТВ сигнала и около 8 МГц для цифрового ТВ сигнала по сжатого по формату MPEG-2, при более высоком качестве).

Ozone

  • Гость
Ширину полосы частот спутникового канала передачи аналогового видео определяет требование обеспечить хорошее соотношение сигнал/шум. Поэтому и модуляция частотная используется. Если бы была амплитудная модуляция, то полоса была бы для профессиональных студий не более 6.5 + 2*1.5 = 9.5 MHz. Это сумма ширин спектров сигналов яркости и двух цветоразностных компонент, передаваемых отдельно.

Другой расчет-упражнение. Ширина полосы частот телефонного канала - 4000 Гц. Передать можно 56 кбит в секунду (модем). Если способ кодирования данных типа используемого в модемах переложить на ширину спектра 8 МГц, получим 56*2000=112 мегабит в секунду. А это 14 Мб/сек - полноэкранное видео PAL в формате 4:1:1. Без компрессии. Если эту цифру даже на три поделить (модем 14400), то качество MJPEG будет отличным.

В цифровых камерах используется коэффициент сжатия MJPEG = 5 при входном формате 4:1:1 или 4:2:2. А качество выходит очень хорошее. В указанной выше статье предполагается, что в любом MPEG2 кодере коэффициент DCT компресии на ключевых кадрах примерно такой же. А промежуточные кадры уж точно не должны выглядеть лучше ключевых. В самом лучшем случае можно уменьшить скорость потока данных вдвое при частичной потере редактируемости. Для DVD это безусловно хорошо. Для нелинейного монтажа - не очень.

Существует версия MPEG-2 разработанная фирмой Sony для своего цифрового формата BetacamSX. Однако данная версия использует только часть возможностей формата MPEG-2 (так называемый Studio Profile), но позволяет записывать видео вещательного качества с компрессией 10:1 (для формата M-JPEG от 5:1 до 3,3:1) и производить покадровый монтаж. Оборудование для данного формата достаточно дорогое из-за очень сложного алгоритма обработки и представляет интерес для крупных телекомпаний.

Основным методом сжатия используемым, как в недорогих (например Marvel G200 Matrox), так и в профессиональных (DigiShuiteLE Matrox) является M-JPEG.

Существенным отличием профессиональной аппаратуры является возможность работы с тайм-кодом, внешней синхронизацией, ввод/вывод ТВ сигнала в компонентном и цифровом форматах. Кроме этого профессиональные кодеки позволяют дистанционно управлять ими по стандартному в ТВ интерфейсу RS-422, превращаясь в цифровые дисковые рекордеры (DDR аналог видеомагнитофона с записью видео на диск и моментальным доступом к любому кадру изображения).

Если вникать в то, чем же отличается профессиональная видеотехника от бытовой, то оказывается, что часто аппаратные средства обработки собственно сигнала у них одни и те же. Для простых потребителей урезается набор функций и иногда искусственно вводят ограничения на качество картинки.

Например, в Matrox Rainbow runner (или Marvel), Miro DC10 , 20, 30, используется один и тот же Zoran чип, но пропорционально цене увеличиваются предельные минимальные коэффициенты компрессии и (или) размеры кадра. У Матрокса размер большой (704х576), но наилучший коэффициент сжатия только 6.1 (3.1 МБ/сек), у DC10 уменьшен размер (352х576), но получше максимальный допустимый поток данных, а у DC20 - DC30 размер кадра увеличивают, поток делают еще побольше, добавляют некоторые удобства и поднимают цену в конце концов вшестеро против Rainbow Runner G от Матрокса.

Запреты на лучшее качество зашивают в драйверы и просят денег за более дорогие модели как за принципиально лучшие. Тот же Rainbow Runner может выдавать по шине PCI до 27 Mб/сек, как уже сообщали в конференции ее пользователей. Но MJPEG компрессор запрограммирован на коэффициент сжатия (порчи картинки) не менее 6.1. Производительчипа пишет, что он "provides up to 11MB/s bandwidth". Разрешили только 3.1 MB/sec. Впрочем, можно и этот запрет преодолеть.

Качество сборки, помехозащищенность, индивидуальная настройка профессиональных плат - за это деньги и берут. Основа часто оказывается общей.

Справедливости ради следует заметить, что многие кодеки уровня бытового и полупрофессионального применения, тоже позволяют использовать специальный пульт управления (так называемый Jog/Shuttle) для поиска видеофрагментов записанных на диск РС или обычный ВМ.

Для более полного понимания дальнейшего изложения в данной статье, приведу небольшие арифметические данные. Как известно изображение в аналоговом видео состоит из 625 для PAL/SECAM (525 для NTSC) строк и состоит из 2 полей по 312,5 (262,5). За 1 секунду передаются 25 (30) кадров или 50 (60) полей. Полоса, занимаемая видеосигналом достигает 6 МГц. Для передачи цвета используется принцип сложения основных цветов: красного(R), синего(B) и зеленого(G) цветов. Аналогичный способ применяется в мониторах и видеокартах. Однако использование 3-х компонентной составляющей для передачи цветного ТВ сигнала представляет существенные ограничения. Основные из них это широкая полоса, занимаемая таким видеосигналом и несовместимость в обычным ЧБ телевидением. Для сужения занимаемой полосы частот и достижения совместимости с ЧБ ТВ сигналом, используются некоторые особенности восприятия изображения человеческим глазом. Было установлено, что человеческий глаз чувствительнее к яркостной составляющей изображения, чем к его цветности. (Это неудивительно, кто знаком с анатомией человеческого глаза знает, что количество колбочек чувствительных к яркости значительно больше количества палочек чувствительных к цветовой составляющей изображения).

Используя эту особенность человеческого зрения, была разработана система цветоразностной передачи цветного изображения. Цветной ТВ сигнал состоит из яркостной (Y) и двух цветоразностных (R-Y и B-Y) составляющих. Обычный ЧБ ТВ приемник воспринимает только Y составляющую и передает изображение в монохромном виде. В цветном ТВ приемнике используя специальные схемы суммирования из трех составляющих (Y, R-Y и B-Y) восстанавливают исходные составляющие цвета красный (R), синий (B) и зеленый (G) цвета, которые подаются на соответствующие электронные пушки кинескопа.

Для сужения полосы частот занимаемой цветным ТВ сигналом, сигналы R-Y и B-Y передают, с использованием полосы частот в 2 раза уже. Полосы частот цветоразностных сигналов сужают с помощью фильтров, и применяют схемы модуляции, позволяющие передавать два цветоразностных сигнала в одном общем участке спектра.

Цветоразностные составляющие передаются так, что их спектр располагается в высокочастотной части спектра сигнала яркости.

Ozone

  • Гость
За счет дополнительных ухищрений с выбором частот поднесущей, модулированной цветоразностными сигналами (PAL или NTSC только), удается даже добиться того, что информация о яркости передается в одних множественных узких участках спектра, а о цвете - в других. В конце концов получается, что ширина спектра цветного видеосигнала при вещании не шире, чем у черно-белого.

Сужение полосы частот снижает разрешающую способность по цвету в 2 раза, но учитывая особенности глаза практически незаметно. В цифровом ТВ принято разбиение одного ТВ кадра на пиксели, что наиболее удобно для дальнейшей цифровой обработки. Каждый ТВ кадр разбивается на 768 точек по горизонтали и 576 точек по вертикали для сигналов PAL/SECAM (640 на 480 для NTSC) при стандартном для ТВ соотношении ширины к высоте изображения равным 4:3. Следует заметить, что в телевидении высокой четкости (ТВЧ или HDTV) принято соотношение 16:9 более близкое к размеру киноэкрана. Таким образом, получается два полукадра (поля) с разрешением 384Х288 (320Х240 для NTSC) при частоте 50(60) полей или 25(30) кадров в секунду.

Считается, что для полного восприятия информации о яркости и цвете необходимо каждую точку изображения передавать как минимум 256 уровнями или 8 битным кодированием. Каждая точка цветного видеоизображения должна кодироваться 24 разрядным словом (8 бит Х 3 составляющие) или по компьютерной терминологии 24 бит/пиксель (24bpp). Для кинематографа используется разрядность 64 бит/пиксель.

Таким образом, перемножив 24х768х576х25 получаем цифровой поток в 265420800 бит/сек или около 265 Мбит/сек для сигналов PAL/SECAM (221 Мбит/сек NTSC). Практически кодирование ТВ сигнала происходит несколько иначе. Учитывая, что для передачи ТВ изображения используется формат Y, R-Y, B-Y, то по сигналу Y производится полное кодирование (8 бит по 768х576 пикс), а по сигналам R-Y и B-Y кодируется либо половина (8 бит по 384х288 пикс), либо четверть (8 бит по 192х144 пикс) для каждого из сигналов R-Y и B-Y. Для простоты используется запись в виде дроби 4:2:2 (иногда 8:4:4) или 4:1:1 (8:2:2).

Следует иметь в виду, что данная дробная запись говорит о количественном соотношении кодируемых точек. Разрядность кодирования каждой точки всегда равна 8, иногда и больше. Данный формат кодирования хорошо совместим с существующими аналоговыми форматами цветного ТВ, где цветоразностные сигналы передаются в полосе частот в 2 раза уже, чем занимают (см выше).

Перемножив полученные данные, получаем цифровой поток около 177 Мбит/сек для разрешения 4:2:2 и около 111 Мбит/сек для 4:1:1 (Все данные приведены для разрешения 768х576 т. е систем PAL/SECAM). Таким образом, для записи полноэкранного видео (PAL/SECAM 768х576х25 кадр/сек) необходимо обеспечить скорость порядка 22 Мбайт/сек для формата 4:2:2 и 14 Мбайт/сек для 4:1:1.

Теоретически такой поток могут обеспечить интерфейсы ATA-33 и UW SCSI (33 и 40 или 80 Мбайт/сек соответственно). Однако, учитывая особенности HDD реально возможно обеспечить скорость порядка 13 Мбайт/сек для HDD UW SCSI 10000 rpm.

Для преодоления этого ограничения используются RAID массивы дисков, способные обеспечить скорость до 40 и более Мбайт/сек с возможностью "горячей" замены без потери данных.

Некоторые кодеки используют встроенные SCSI контроллеры. Так кодек канадской фирмы DPS под названием Hollywood для записи полного видео без компрессии использует минимум 2 пары Wide SCSI HDD подключаемых к встроенному контроллеру. Кроме обеспечения заданной скорости, очень важным условием является обеспечение непрерывности потока данных. Обычные HDD данный режим обеспечить не могут, поскольку через определенное время производят термокалибровку головок, прерывая поток данных.

Для записи видео выпускаются специальные диски (так называемые AV диски) в которых эта проблема устранена. Учитывая эти особенности, можно сделать вывод о достаточно высокой стоимости подобного комплекса. Действительно стоимость комплекта вышеописанного кодека фирмы DPS составляет более $6000 без учета стоимости HDD и дополнительной платы для наложения графики по альфа-каналу. Учитывая что на 1Гб пространства HDD можно записать около минуты видео в формате 4:2:2, можно представить необходимые объемы дискового пространства для организации 24 часового вещания с видеосервера. Стоимость хранения одной минуты получается существенно дороже чем при использовании традиционной магнитной ленты. Однако высокая оперативность прямого доступа с точность до кадра, определяет основные области использования таких комплексов в новостийных программах и прямых трансляций.

Отдельное спасибо за помощь Григорию Байцуру

http://www.ixbt.com/divideo/dignonline.html