БЛОГ PICVARIO

Метаданные имеют значение: разгребаем хаос из digital материалов

Всем привет! Меня зовут Сергей Фомин, я CEO IT-разработчика Picvario. Мы делаем сервис, который систематизирует – читай, наводит порядок в корпоративных фото, видео и аудио. О подводных камнях в работе с медиа материалами я знаю не понаслышке – уже 20 лет я руковожу фотоагентством. Больше 5 тыс. фотографий из нашего архива ежедневно используют российские и зарубежные СМИ.


Сегодня я расскажу, почему в цифровую эпоху не выжить без метаданных, и поделюсь несколькими инсайтами о цифровом будущем работы с контентом. Дипфейки, синтетический контент, инклюзивность в медиа и NFT – уже наша реальность, которая стремительно развивается.


Содержание

  • Метаданные: что это и для чего они нужны
  • Краткий экскурс в IPTC/XMP
  • Системы для чтения и заполнения метаданных
  • Развитие цифровой (не)реальности

Метаданные: что это и для чего они нужны


В digital эру мы генерируем гигантское количество контента. Чтобы вы понимали – в среднем человек производит 1,7 мб контента в секунду! И это с учетом, что у 35% человечества еще нет доступа к интернету.


Чтобы как-то ориентироваться во всех производимых цифровых материалах, используются метаданные – они уточняют основную информацию о файле.


Информация записываются внутри самих файлов или в файлах сопровождения: XML, XMP, JSON и др. С помощью метаданных пользователь в прямом смысле «считывает», зачем, когда и где был создан медиафайл, и можно ли его вообще использовать.

Рис.1. Пример заполненных полей метаданных с текстовой информацией о файле

Существуют разные типы метаданных, самые распространенные из них – EXIF и IPTC/XMP.


EXIF метаданные содержат в основном техническую информацию о цифровом файле – настройках камеры в момент создания снимка. Стандарт включает информацию о геолокации, модели камеры, режиме вспышки, формате файла, дате и времени его создания и т.д.



Рис.2. Пример метаданных стандарта EXIF


Однако, EXIF включает лишь сухие факты о настройках оборудования – этих данных недостаточно для понимания предназначения медиафайла. Лирика спрятана в метаданных формата IPTC/XMP.


Стандарт содержит более 200 полей метаданных, тем самым лучше раскрывает саму суть файла: что на нем изображено, его название, описание, назначение, дата создания, ключевые слова – теги, и другую информацию.

Особое внимание уделяется и авторству контента – можно указать, кто создатель, условия лицензии на фото или видео.

Рис.3. Информация, которую содержат IPTC/XMP метаданные изображения.
Источник: iptc.org

Краткий экскурс в IPTC/XMP


Стандарт IPTC/XMP был разработан еще в конце 60-х группой новостных медиа – Международным Советом по Прессе и Телекоммуникациям. В настоящее время в организацию входят более 60 представителей СМИ, включая таких гигантов, как Adobe, Agence France-Presse, Bloomberg, Reuters, Getty Images и др.


Я и сам являюсь представителем Совета Европейских Медиаагентств (CEPIC) в организации IPTC и участвую в разработке стандарта. Само собой, наше ПО Picvario поддерживает стандарты IPTC. В этом смысле это одно из преимуществ нашего IT-решения Picvario, что мы сами участвуем в развитии стандарта метаданных, влияющих на всю индустрию управления цифровыми медиафайлами.


С переходом в цифровой век при пересылке фото или видеоматериалов часто терялись данные о медиафайле: его название, описание, информация об авторстве контента и т.д. Основная цель организации сегодня – развить и распространить в отрасли стандарты для обмена данными об активах.


Кстати, можете на практике посмотреть, какие метаданные содержатся в ваших фотографиях, и при необходимости, отредактировать их через нашу бесплатную программу MetaEditor.

Рис.4. Пример метаданных стандарта IPTC/XMP

Системы для чтения и заполнения метаданных


Практически все проф ПО умеет работать с метаданными IPTC/XMP, например, Adobe Photoshop, Bridge, ACDSee и др. Это касается и отдельно разработанных DAM-систем – в том числе и Picvario. Мы изначально разрабатывали платформу, поддерживающую уже существующие стандарты.


Приведем пример использования систем управления медиаконтентом. Редактору медиа присылают фотографии и видео с места событий. Далее он должен оперативно транслировать эти материалы в более низком разрешении новостникам для публикаций, а оригиналы поместить в архив. При этом важно обязательно указать копирайтинг и данные о лицензии на использование изображений. Хорошая новость – все эти операции с контентом можно провести через DAM-системы.


Нужно сказать, что DAM давно уже используют за пределами одних только СМИ. Инструменты организации медиаконтента с успехом применяют в учебных заведениях, маркетинговых агентствах, производственных предприятиях и т.д. Все большое распространение набирает практика использования DAM в организациях культурного наследия: галереях, библиотеках, архивах и музеях.


Так, в 2018 году из-за отсутствия системы хранения контента, случилась страшная трагедия в сфере искусства. В Национальном Музее Бразилии случился пожар, в котором сгорели и были безвозвратно утеряны более 20 млн экспонатов. При наличии платформы DAM у музея, удалось бы сохранить цифровые копии предметов искусства.

Развитие цифровой (не)реальности


Члены и специалисты IPTC/XMP активно лоббируют и развивают инклюзивность стандарта метаданных. В последнем релизе IPTC/XMP появилось поле Alt Text и в дополнение к нему Extended Description.


Нововведения касаются слабовидящих и незрячих людей – в мире их больше 320 млн. В Alt Text можно внести описание об изображении – эту информацию программы чтения с экрана трансформируют в аудиальную, и люди с нарушением зрения могут «увидеть» картинку, фотографию или другой визуальный контент. Отмечу, что поле Alt Text интегрировано и в системе Picvario.


Есть и другие темы, которые стоят на повестке дня. Так, этой весной представители IPTC/XMP обсуждали современные вызовы работы с медиаконтентом.


Одна из актуальных тем – роль метаданных для NFT. Для контекста – NFT это цифровой актив, который можно купить и продать. Его цена определяется ценностью объекта: это может быть изображение, картина, видео, первый твит в истории и т.д. И вот чтобы NFT представлял ценность на рынке – нужны метаданные, описывающие характеристики актива.


На IPTC/XMP встрече поднимались и другие острые темы в мире цифровых технологий: например, применение искусственного интеллекта (ИИ) для создания синтетического контента. Сегодня мы можем представить себе что угодно, ИИ способен воссоздать любую нашу фантазию.

Рис.5. Первая виртуальная модель Шуду Грэм, созданная на базе системы ИИ. Источник: instagram.com


Еще одна тема последних лет, о которой не пишет только ленивый – совершенствование производства дипфейков. Если раньше на создание реалистичного дипфейка уходило много времени и тонна видеоматериалов, сегодня создавать его уже можно в прямом эфире. Многим политикам, селебрити и другим медийным личностям уже не до смеха – для борьбы с фейками и аутентификации цифровых изображений была создана коалиция C2PA. Туда вошли медийные гиганты – Microsoft, Adobe, BBC, Intel и др. Ожидается, что производитель контента будет присваивать активам цифровой сертификат, фиксирующий информацию о его первичном формате, объеме, владельце и т.д.


По словам Хани Фарида – специалиста в области компьютерных наук из Калифорнийского университета, он был уверен, что на создание «живых» дипфейков потребуется примерно пять лет. Практика показала – он был неправ, пугающе реалистичные модели стали создавать уже спустя два года.


В любом случае цифровые технологии открывают грандиозные возможности для человечества, главное – смотреть во все глаза и внимать, чтобы ничего не прозевать.

Читайте еще:
    Made on
    Tilda