БЛОГ PICVARIO

Теги изображений. Что это и как DAM автоматизируют работу с ними

Сегодня сложно представить какую-либо компанию, которая обходится в своей деятельности без визуального контента — цифровых фотографий, инфографики, видеофайлов и других медиа форматов — для достижения своих маркетинговых целей.


Контента становится всё больше: по данным глобального прогноза аналитического агентства insightSLICE, к 2030 году объем рынка производства цифрового контента во всем мире достигнет $38 млрд. при среднегодовом темпе роста 12%.


Поэтому перед компаниями закономерно встает вопрос, как управлять контентом? Ответ очевиден — теги изображений. Ниже рассмотрим, какие инструменты DAM помогают в работе с визуальными данными.

Метаданные


Организации и частные пользователи нуждаются в эффективных способах находить визуальные файлы. В XXI веке пользователь привык искать нужный файл в Google и Яндекс по ключевому запросу. Как организовать такую же систему внутри контура компании? Ответ — метаданные.


Метаданные — это информация, которая описывает другие данные, или просто данные о данных. Метаданные являются неотъемлемой частью контента. Они сообщают, откуда взялся контент, кому он предназначен и как его можно использовать. Метаданные несут информацию, которая объединяет нас с нашими активами и позволяют в них ориентироваться. Мы писали подробно о них в этой статье.


Представим ситуации:

  • У вас есть отличный визуальный материал, но ваши потребители контента не могут его найти и использовать. Ценность этого контента равна нулю.
  • У вас есть файл с участием вашего СЕО на мероприятии, присутствуют приглашенные гости. Кто на изображении и что за мероприятие? Вы не знаете и вы вне контекста, в итоге изображение не используются.

Тегирование


Теги или ключевые слова — это еще одно поле метаданных.


Взгляните на изображение, что вы видите?

Вы можете сказать “гранат”, “виноград”, “яблоко”, “виноград” и “инжир”. Это и есть процесс тегирования, а указанные вами слова — теги.


Таким образом, теги — это “словесные подсказки”, описывающие изображение, а тегирование — это процесс маркировки или установки ключевых слов для элементов.По этим тегам, как и любым метаданным, в дальнейшем осуществляется быстрый поиск и идентификация изображений.


Для тегирования редактору нужно представить, как пользователь смог бы найти изображение и учесть все возможные поисковые запросы. В зависимости от потребностей это могут быть цвета, объекты и другие характеристики изображения, включая абстрактные термины, настроение и эмоции. Например, в нашем примере это могут быть теги “дерево”, “фактура”, “деревня”, “темный фон”, “натюрморт”, “фрукты”, “ягоды”, “красный”, “зеленый”, “сладкий”, и т.д.

Системы управления метаданными изображений


Если своевременно не дополнять файлы метаданными, то возникает риск вместо полноценной цифровой библиотеки получить хаотичные списки файлов и папок с загадочными названиями.


Исходя из нашей практики, в компаниях так и происходит — это замедляет ход проектов и процессов. Более того, такой беспорядок может в конечном итоге привести к ощутимым издержкам на наведение порядка и даже к судебным разбирательствам, связанным с нарушением авторских прав.


Современной альтернативой работы с медиа стали платформы управления цифровыми активами (DAM, от англ. Digital Assets Management). DAM-cистемы были разработаны специально под специфику визуальных форматов файлов: они умеют работать с метаданными и формируют уменьшенному версию файла (т.н. прокси).


Для управления большими массивами данных в DAM существуют такие возможности, как построение древовидных структур (или таксономии) коллекции, шаблоны заполнения метаданных и инструменты обогащения метаданных и тегов на базе искусственного интеллекта.

Проблемы тегирования и решение в DAM


Есть несколько проблем относительно тегирования, с которыми организации сталкиваются в процессе:

  1. Несоответствия тегов и визуального содержания контента.
  2. Если контент не помечен точно, этот актив рискует быть потерянным и никогда не будет найден или использован снова,
  3. Заполнение метаданных требует автоматизированного подхода, так как крайне трудоемко помечать контент вручную

Давайте рассмотрим, как решение этих проблем проливает свет на ценность метаданных для бизнеса.

Теги: текст = визуальному содержанию


Отличным и всем знакомым примером тегирования служат стоковые банки изображений. Создатели контента зарабатывают с каждым скачиванием файла.


Поэтому фотографы стараются добавить максимальное количество тегов, чтобы их изображение чаще появлялось в поисковой выдаче. Однако, порой нерелевантные теги сбивают с толку пользователей. Например, по ключевому запросу “Ключ” и сортировке по релевантности, в результатах поиска фотобанка появляет все, кроме изображения ключа (и неважно как источника воды, замочного ключа или инструмента). Это говорит об избыточном нерелевантном тегировании.

Поисковая выдача фотобанка по запросу “Ключ”

Для контроля над избыточным тегирования в DAM используются Списки тегов или контролируемые списки. Это возможность выбрать теги из списка, который контролируется администратор DAM.



Контролируемый список с возможностью выбора региона России

Мало тегов — тоже плохо


Негативный эффект может нести и недостаточное тегирование. Ведь в этом случае нужный файл просто не найдут — возможно, это потребует его воссоздания и дополнительных бюджетов на продакшн.


Посмотрите пример, очевидно было бы использовать тег “Йога” для описания этого изображения. К сожалению, его нет, и возможно это изображение так никогда и не найдет своего пользователя.

Пример недостаточного тегирования

Автоматизация заполнения тегов


Описать метаданными один файл, одну фотосессию, пару месяцев продакшена — монотонная, но вполне реальная задача. Но если мы говорим о контенте за несколько десятков лет компании — ручными способами тегирования уже не справиться. На помощь в DAM приходит массовое редактирование, шаблоны метаданных и искусственный интеллект.


Шаблоны метаданных

Пакетная маркировка — это быстрый способ в DAM применить заранее установленные метаданные к цифровым файлам, то есть это применение одного и того же набора свойств к группе файлов. В Picvario эта функция реализована через шаблоны метаданных, которые позволяют это сделать парой щелчков мыши.

Искусственный интеллект

Решения на основе искусственного интеллекта становятся все более распространенным явлением в решениях DAM. Системы ИИ автоматически обогащают файлы метаданными. Это не только экономия времени, особенно для обширных цифровых библиотек, но и новые возможности для поиска и сортировки файлов. Клиенты Picvario уже используют:


Распознавание лиц, эмоций, возраста

Достаточно один раз указать имя персоны на лице, после этого система узнает человека на всех ранее загруженных файлах, а также на вновь импортируемых. Поисковая выдача с запросом имени выведет все файлы с персоной. Эти поисковые запросы можно комбинировать с другими фильтрами, чтобы уточнять результаты поиска.

Автоматическое тегирование объектов

Самая востребованная функция ИИ в DAM, и даже мысль звучит волшебно, представьте: загрузили файл, нейронная сеть автоматически распознала объекты. Однако, как мы выяснили в процессе тестирования разных поставщиков ИИ решений, есть и подводный камень — разные решения ИИ подходят под разную тематику изображений.


Из наших заметок:

  1. VK Cloud (Mail.ru) — хорошо справляется с распознаванием лиц, эмоций и локаций. Поэтому для этих задач и внедрена в Picvario. Распознавание объектов недостаточно высокого качества, так к примеру сеть не идентифицирует мужчин, женщин, определяет пол только в 10% случаев, указывая только тег “Человек”.
Пример распознавания людей у поставщика VC Cloud.

2. Everypixel — хорошо распознает объекты, из испытуемых поставщиков наилучшие показатели распознавания. Определяет возрастные категории, эмоции (улыбку), времена года. Из недостатков — недостаточная проработка тегов у локаций: в основном это только теги indoor/outdoor.


3. Google Cloud Vision API — хорошо идентифицирует лица, объекты, этикетки, логотипы, текст, свойства (цвета), ландшафты, виды спорта и животных. Имеет безопасный поиск (расизм, насилие и т.д.).

Сет для тестирования и результаты в таблице EveryPixel vs Google Cloud

4. Amazon Rekognition AWS — отдаёт теги с таксономией, то есть показывает родительские теги. Хорошо натренирован на распознавание солнцезащитных очков.


5. Microsoft Azure — распознает и добавляет имена публичных персон, например спортсменов, а также формирует краткое описание фото, которое не дублирует теги.

В DAM может быть внедрена любая готовая нейронная система по запросу пользователя, также есть возможность обучить сеть распознавать объекты, которые применимы к вашей специфике, например, машины, птиц, цветы и т.д.. Система технологически готова к внедрению любой системы ИИ благодаря разработанному блоку Picvario Vision и открытому API. Это позволит сэкономить ресурсы на внедрении.

Автоматический перевод метаданных

Так как все поставщик систем распознавания объектов на базе ИИ, включая российские, добавляют теги только на английском языке, было решено внедрить автоматический перевод метаданных. Доступны к подключению 184 языка по стандарту ICO 639.

Автоматический перевод тегов ИИ на русский и французский языки

Минутка юмора в завершении


Несмотря на все плюсы внедрения нейросетей в DAM и их постоянное усовершенствование, следует понимать, что ИИ пока не готов заменить человека на 100%. Это мощный помощник для оптимизации задач сотрудников, но не конкурент. DAM-системы с технологиями ИИ не исключают необходимость “живого” редактора и администратора системы, ведь нейросети до сих пор не совершенны. Это касается и тегирования, в процессе тестирования систем мы сталкивались с некоторыми смешными ошибками ИИ, которые надеемся, повеселят и вас тоже ????

  1. Microsoft Azure распознал в сотруднике шахты металлургического завода голливудскую звезду Марка Стивенсона.

2. Это милая мордашка альпаки настолька человечна, что ИИ распознал в ней персону.

Заключение


Количество контента в интернете растет с космической скоростью. Уверены, ваш архив тоже. Поэтому система управления контентом становится необходима как воздух. Технологические системы, такие как DAM Picvario, позволяют оптимизировать процесс обработки контента благодаря продвинутому функционалу и системами искусственного интеллекта. Предлагаем вам забронировать бесплатную демонстрацию Picvario, для этого необходимо отправить запрос на почту info@picvario.com. Ведь лучше один раз увидеть, чем сто раз услышать :)

Читайте еще:
    Made on
    Tilda