Основные параметры-аргументы в методах обработки изображений

Для выделения и исследования различных объектов на изображении (видео) используют различные фильтры, как часть основного алгоритма для подготовки изображения к анализу.
Огромное количество сервисов, которым для работы нужен, например, контур лица и, чтобы его получить, данные сервисы прибегают к различным ухищрениям: пользователь сам изгибает(«подгоняет») предложенные линии так, чтобы они совпали с искомым контуром. Например, такую «модель поиска контура на изображении» использует microsoft в своих сервисах windows live. Следовательно, разработчикам по каким-то причинам было трудоемко это организовать (т.е. даже несмотря на их огромную исследовательскую команду в microsoft research разработчики перекладывают непростой процесс на плечи пользователей, никак его не упрощая).

Подведем некоторый анализ и итоги вышесказанного: разработчикам (тем более которые не имеют ресурсов) трудно реализовывать подобные задачи из-за их большой неопределенности в решении и большой трудоемкости, однако в настоящее время существуют библиотеки (opencv к примеру), которые существенно упрощают подобного типа задачи (в данной статье решения класса faceapi и других подобных платных продуктов не рассматриваются).

Первоначально разработчики сталкиваются с такой проблемой: с чего начать? И приходят к основной проблеме в данной задаче: как её упростить, как уменьшить исследование всевозможных изображений, которые могут быть загружены пользователями, содержимое которых компьютеру, естественно, непонятно. И на помощь приходят различные алгоритмы, которые вместе способны свести задачу на более понятный для анализа уровень.

Какие оптимальные параметры для алгоритмов компьютерного зрения?

Рассмотрим параметры некоторых фильтров:

Поиск и анализ таких параметров основан на полутора годовых исследованиях по данным тематикам и методом проб, ошибок, огромного количества неудач, дополнительной литературы оптимальными были найдены следующие параметры, повторюсь, данные параметры — попытка найти «золотую середину», чтобы сделать их наиболее универсальными:

Примечание: далее названия параметров и комментарии к ним приведены на английском языке с более точного определения данных понятий

Смазывание изображения по Гауссу:

  • The width of the Gaussian kernel = 5
  • The height of the Gaussian kernel = 5
  • The height of the Gaussian kernel = 1.4
  • The height of the Gaussian kernel = 1.4

Удаление «царапин» и шума из однородного фона

  • (Erode/Dilate):The number of erode/dilate iterations = 4

Выделение контуров методом Канни

  • The threshhold to find initial segments of strong edges = 100
  • The threshold used for edge Linking = 50

Метод FindContours в OpenCV

  • The type of approximation method = CV_CHAIN_APPROX_TC89_KCOS

Также по теме:
Scharr, Hanno, 2000, дессертация (в Германии) Optimal Operators in Digital Image Processing


0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.