Основные параметры-аргументы в методах обработки изображений
Для выделения и исследования различных объектов на изображении (видео) используют различные фильтры, как часть основного алгоритма для подготовки изображения к анализу.
Огромное количество сервисов, которым для работы нужен, например, контур лица и, чтобы его получить, данные сервисы прибегают к различным ухищрениям: пользователь сам изгибает(«подгоняет») предложенные линии так, чтобы они совпали с искомым контуром. Например, такую «модель поиска контура на изображении» использует microsoft в своих сервисах windows live. Следовательно, разработчикам по каким-то причинам было трудоемко это организовать (т.е. даже несмотря на их огромную исследовательскую команду в microsoft research разработчики перекладывают непростой процесс на плечи пользователей, никак его не упрощая).
Подведем некоторый анализ и итоги вышесказанного: разработчикам (тем более которые не имеют ресурсов) трудно реализовывать подобные задачи из-за их большой неопределенности в решении и большой трудоемкости, однако в настоящее время существуют библиотеки (opencv к примеру), которые существенно упрощают подобного типа задачи (в данной статье решения класса faceapi и других подобных платных продуктов не рассматриваются).
Первоначально разработчики сталкиваются с такой проблемой: с чего начать? И приходят к основной проблеме в данной задаче: как её упростить, как уменьшить исследование всевозможных изображений, которые могут быть загружены пользователями, содержимое которых компьютеру, естественно, непонятно. И на помощь приходят различные алгоритмы, которые вместе способны свести задачу на более понятный для анализа уровень.
Какие оптимальные параметры для алгоритмов компьютерного зрения?
Рассмотрим параметры некоторых фильтров:
Поиск и анализ таких параметров основан на полутора годовых исследованиях по данным тематикам и методом проб, ошибок, огромного количества неудач, дополнительной литературы оптимальными были найдены следующие параметры, повторюсь, данные параметры — попытка найти «золотую середину», чтобы сделать их наиболее универсальными:
Примечание: далее названия параметров и комментарии к ним приведены на английском языке с более точного определения данных понятий
Также по теме:
Scharr, Hanno, 2000, дессертация (в Германии) Optimal Operators in Digital Image Processing
Огромное количество сервисов, которым для работы нужен, например, контур лица и, чтобы его получить, данные сервисы прибегают к различным ухищрениям: пользователь сам изгибает(«подгоняет») предложенные линии так, чтобы они совпали с искомым контуром. Например, такую «модель поиска контура на изображении» использует microsoft в своих сервисах windows live. Следовательно, разработчикам по каким-то причинам было трудоемко это организовать (т.е. даже несмотря на их огромную исследовательскую команду в microsoft research разработчики перекладывают непростой процесс на плечи пользователей, никак его не упрощая).
Подведем некоторый анализ и итоги вышесказанного: разработчикам (тем более которые не имеют ресурсов) трудно реализовывать подобные задачи из-за их большой неопределенности в решении и большой трудоемкости, однако в настоящее время существуют библиотеки (opencv к примеру), которые существенно упрощают подобного типа задачи (в данной статье решения класса faceapi и других подобных платных продуктов не рассматриваются).
Первоначально разработчики сталкиваются с такой проблемой: с чего начать? И приходят к основной проблеме в данной задаче: как её упростить, как уменьшить исследование всевозможных изображений, которые могут быть загружены пользователями, содержимое которых компьютеру, естественно, непонятно. И на помощь приходят различные алгоритмы, которые вместе способны свести задачу на более понятный для анализа уровень.
Какие оптимальные параметры для алгоритмов компьютерного зрения?
Рассмотрим параметры некоторых фильтров:
- Смазывание изображения по Гауссу
- Популярные морфологические преобразования:
- Популярный метод: Выделение контуров методом Канни
- Метод FindContours реализованный в OpenCV
Поиск и анализ таких параметров основан на полутора годовых исследованиях по данным тематикам и методом проб, ошибок, огромного количества неудач, дополнительной литературы оптимальными были найдены следующие параметры, повторюсь, данные параметры — попытка найти «золотую середину», чтобы сделать их наиболее универсальными:
Примечание: далее названия параметров и комментарии к ним приведены на английском языке с более точного определения данных понятий
Смазывание изображения по Гауссу:
- The width of the Gaussian kernel = 5
- The height of the Gaussian kernel = 5
- The height of the Gaussian kernel = 1.4
- The height of the Gaussian kernel = 1.4
Удаление «царапин» и шума из однородного фона
- (Erode/Dilate):The number of erode/dilate iterations = 4
Выделение контуров методом Канни
- The threshhold to find initial segments of strong edges = 100
- The threshold used for edge Linking = 50
Метод FindContours в OpenCV
- The type of approximation method = CV_CHAIN_APPROX_TC89_KCOS
Также по теме:
Scharr, Hanno, 2000, дессертация (в Германии) Optimal Operators in Digital Image Processing
0 комментариев