fbpx
Wikipedia

Reconocimiento de regiones

En el campo de la visión artificial, el reconocimiento de regiones se refiere a las técnicas cuyo objetivo es detectar puntos o regiones más claras o más oscuras de la imagen. Hay dos clases principales de detectores de regiones (i) métodos diferenciales y (ii) métodos basados en extremos locales. Estos detectores también se denominan detectores de puntos interesantes, o detectores de regiones interesantes (véase también detección de puntos de interés y detección de esquinas).

El estudio y desarrollo de estos detectores es importante por varias razones. La principal es dar información complementaria sobre regiones que no se puede obtener mediante detectores de bordes o detectores de esquinas. Los detectores de regiones se usan como paso previo para el reconocimiento de objetos o seguimiento de objetos. Otro uso habitual de estos detectores tiene que ver con el análisis de texturas y su reconocimiento. Recientemente, los descriptores de regiones han empezado a usarse para puntos de interés para informar de la presencia de determinados objetos en una imagen.

Estas técnicas, en combinación con otras, tienen ya aplicaciones de uso más cotidiano: por ejemplo para software de dispositivos táctiles, funciones de detección de rostros y sonrisas en cámaras de fotos, sistemas de vigilancia y seguridad, o para analizar imágenes médicas (Diagnóstico Asistido por Ordenador).

El laplaciano de Gauss

Uno de los primeros y más comunes detectores de regiones se basa en el operador laplaciano de Gauss (LoG en inglés). Dada una imagen de entrada  , esa imagen está convuelta por un kernel Gaussiano:
 
a una determinada escala   para dar una representación “escala-espacio":[1] . Así, el operador laplaciano viene dado por:
 
Y normalmente da una fuerte respuesta positiva para regiones oscuras de extensión   y negativa para regiones claras de tamaño similar. El principal problema al aplicar este operador a escala única es que su respuesta es muy dependiente de la relación entre el tamaño de la región y el tamaño del kernel Gaussiano usado para preparar la imagen. Para detectar automáticamente regiones de tamaño desconocido es necesaria una aproximación a varias escalas. Una manera sencilla de obtener esta aproximación es considerar el laplaciano de escala normalizada

 

y detectar los máximos/mínimos de la representación escala-espacio, que son puntos simultáneamente máximos/mínimos locales de   con respecto tanto a espacio como escala (Lindeberg 1994, 1998). Por tanto, dada una imagen discreta en dos dimensiones   se forma una imagen 3D discreta escala-espacio de volumen  , y un punto se considera como una región clara si el valor en ese punto es mayor que el valor en sus 24 vecinos (y menor para regiones oscuras). Así pues, selecciones simultáneas de puntos de interés   y escalas   se llevan a cabo conforme a

 .

Esta interpretación de la región proporciona una definición matemática precisa de lo que entendemos por "región", que nos lleva a un algoritmo eficiente y robusto para la detección de regiones. Algunas propiedades básicas de estas regiones son que las respuestas son covariantes con su traslado, rotación y re-escalado en el dominio de la imagen. Así pues, si un máximo de la escala-espacio se encuentra en el punto   entonces al redimensionar la imagen bajo una escala de factor  , habrá un máximo de la escala-espacio en   de la imagen redimensionada (Lindeberg 1998). Esta propiedad es de gran utilidad en la práctica y se usa también para la selección de escala en otros contextos, como la detección de esquinas y el reconocimiento de objetos.

La diferencia Gaussiana

Partiendo de que la representación escala-espacio   cumple la ecuación de la difusión

 

sabemos que el laplaciano de Gauss   se puede obtener como el límite de la diferencia entre dos imágenes suavizadas Gaussianamente

 .

En la visión artificial, a esto se le denomina Diferencia de Gauss. Salvando las diferencias, este operador es muy similar al Laplaciano, y se puede ver como una aproximación del operador Laplaciano.

El determinante del Hessiano

Si consideramos el determinante del Hessiano a escala normalizada, también llamado operador Monge–Ampère,

 

donde   denota la matriz Hessiana de  , y calculamos los máximos de la función, se obtiene otro detector diferencial de regiones, con selección automática de escala

 .

Los puntos de la región   y escalas   vienen también definidos por una operación geométrica diferencial que nos conduce a descriptores de regiones covariantes al traslado, rotado y reescalado de la imagen. En términos de selección de escala, las regiones definidas por máximos del determinante de Hessiano también tienen mejores propiedades de selección de escala bajo transformaciones afines no Euclídeas.

El híbrido Laplaciano y determinante del Hessiano (Hessian-Laplace operator)

Se ha propuesto un operador híbrido entre el Laplaciano y el determinante del Hessiano, que realiza la selección espacial mediante el determinante del Hessiano y la escala mediante el Laplaciano (Mikolajczyk and Schmid 2004):

 
 

Este operador ha sido usado para detección de imágenes, reconocimiento de objetos y análisis de texturas.

Detectores diferenciales de regiones para transformaciones afines

Los descriptores de regiones obtenidos mediante estos detectores con selección automática de escala no varían con el traslado, rotado y redimensionado (uniforme) de la imagen en el dominio espacial. Las imágenes que recibe un sistema de visión artificial son, sin embargo, susceptibles a distorsiones de perspectiva. Para obtener descriptores de regiones más robustos a estas distorsiones, es necesario crear detectores invariantes a transformaciones afines. En la práctica, puntos invariantes afines se pueden obtener aplicando una adaptación de forma afín a un descriptor de región, donde la forma del kernel de alisado es deformada reiteradamente para ajustarse a la estructura de la imagen, o lo que es lo mismo, una imagen de ajuste se va deformando mientras la forma del kernel de alisado se mantiene rotacionalmente simétrica (Lindeberg and Garding 1997; Baumberg 2000; Mikolajczyk and Schmid 2004, Lindeberg 2008/2009 ). De esta forma, podemos definir una versión adaptada a transformaciones afines del operador Laplaciano/Diferencia de Gauss, el determinante del Hessiano y el operador Hessiano-Laplaciano (ver Harris-Affine[2]​ y Hessian-Affine[3]​).

Regiones en escala de grises, árboles y regiones escala-espacio

Una forma natural de detectar regiones es asociar máximos locales con áreas claras, y mínimos con áreas oscuras. El inconveniente de esto es que los extremos locales son muy sensibles al ruido. Para solventar esto, Lindeberg (1993, 1994) estudió el problema de detectar máximos locales con extensión a múltiples escalas. Una región con extensión espacial se asocia con cada máximo local. Un extremo local con extensión definida de esta forma se considera una región en escala de grises. Además, se define un árbol de regiones en escala de grises para capturar la estructura topológica anidada de los niveles de intensidad del paisaje, de manera que es invariante a las deformaciones afines en el dominio de la imagen y a las transformaciones de intensidad monótonas. Estudiando cómo evolucionan estas estructuras a escalas crecientes, aparece la idea de regiones escala-espacio.

Se propuso que las regiones de interés y los descriptores de escala obtenidos por esta vía, junto con escalas de niveles asociadas y definidas de las escalas de las que se normalizaron las medidas de la dureza de la región que asumieron su máximo en las escalas, se pudieran usar para guiar otros procesados visuales.

Lindeberg desarrolló un algoritmo para detectar regiones en escala de grises que se sigue usando y puede ser consultado aquí,[4]​ así como algoritmos derivados del mismo.[5]

Véase también

Referencias

  1. en:Scale-space
  2. en:Harris-Affine
  3. en:Hessian-Affine
  4. http://www.csc.kth.se/~tony/abstracts/CVAP84.html
  5. en:Blob detection#Lindeberg.27s watershed-based grey-level blob detection algorithm

Bibliografía

  • Christopher Evans. . Archivado desde el original el 3 de noviembre de 2015. Consultado el 26 de abril de 2010. 
  • H. Bay, T. Tuytelaars and L. van Gool (2006). «SURF: Speeded Up Robust Features». Proceedings of the 9th European Conference on Computer Vision, Springer LNCS volume 3951, part 1. pp. 404--417. 
  • L. Bretzner and T. Lindeberg (1998). «Feature Tracking with Automatic Selection of Spatial Scales» (abstract page). Computer Vision and Image Understanding 71: pp 385--392. doi:10.1006/cviu.1998.0650. 
  • T. Lindeberg (1993). «Detecting Salient Blob-Like Image Structures and Their Scales with a Scale-Space Primal Sketch: A Method for Focus-of-Attention» (abstract page). International Journal of Computer Vision 11 (3): pp 283--318. doi:10.1007/BF01469346. 
  • T. Lindeberg (1994). Scale-Space Theory in Computer Vision. Springer. ISBN 0-7923-9418-6. 
  • T. Lindeberg (1998). «Feature detection with automatic scale selection» (abstract page). International Journal of Computer Vision 30 (2): pp 77--116. 
  • T. Lindeberg and J. Garding (1997). «Shape-adapted smoothing in estimation of 3-{D} depth cues from affine distortions of local 2-{D} structure». International Journal of Computer Vision 15: pp 415--434. 
  • T. Lindeberg (2008/2009). «Scale-space». Encyclopedia of Computer Science and Engineering (Benjamin Wah, ed), John Wiley and Sons IV: 2495--2504. doi:10.1002/9780470050118.ecse609. 
  • D. G. Lowe (2004). «Distinctive Image Features from Scale-Invariant Keypoints». International Journal of Computer Vision 60 (2): pp 91-110. doi:10.1023/B:VISI.0000029664.99615.94. 
  • J. Matas, O. Chum, M. Urban and T. Pajdla (2002). «Robust wide baseline stereo from maximally stable extremum regions». British Machine Vision Conference. pp. 384-393. 
  • K. Mikolajczyk, K. and C. Schmid (2004). «Scale and affine invariant interest point detectors». Integration of the multi-scale Harris operator with the methodology for automatic scale selection as well as with affine shape adaptation. International Journal of Computer Vision 60 (1): pp 63-86. doi:10.1023/B:VISI.0000027790.02288.f2. 
  •   Datos: Q1026711

reconocimiento, regiones, campo, visión, artificial, reconocimiento, regiones, refiere, técnicas, cuyo, objetivo, detectar, puntos, regiones, más, claras, más, oscuras, imagen, clases, principales, detectores, regiones, métodos, diferenciales, métodos, basados. En el campo de la vision artificial el reconocimiento de regiones se refiere a las tecnicas cuyo objetivo es detectar puntos o regiones mas claras o mas oscuras de la imagen Hay dos clases principales de detectores de regiones i metodos diferenciales y ii metodos basados en extremos locales Estos detectores tambien se denominan detectores de puntos interesantes o detectores de regiones interesantes vease tambien deteccion de puntos de interes y deteccion de esquinas El estudio y desarrollo de estos detectores es importante por varias razones La principal es dar informacion complementaria sobre regiones que no se puede obtener mediante detectores de bordes o detectores de esquinas Los detectores de regiones se usan como paso previo para el reconocimiento de objetos o seguimiento de objetos Otro uso habitual de estos detectores tiene que ver con el analisis de texturas y su reconocimiento Recientemente los descriptores de regiones han empezado a usarse para puntos de interes para informar de la presencia de determinados objetos en una imagen Estas tecnicas en combinacion con otras tienen ya aplicaciones de uso mas cotidiano por ejemplo para software de dispositivos tactiles funciones de deteccion de rostros y sonrisas en camaras de fotos sistemas de vigilancia y seguridad o para analizar imagenes medicas Diagnostico Asistido por Ordenador Indice 1 El laplaciano de Gauss 2 La diferencia Gaussiana 3 El determinante del Hessiano 4 El hibrido Laplaciano y determinante del Hessiano Hessian Laplace operator 5 Detectores diferenciales de regiones para transformaciones afines 6 Regiones en escala de grises arboles y regiones escala espacio 7 Vease tambien 8 Referencias 9 BibliografiaEl laplaciano de Gauss EditarUno de los primeros y mas comunes detectores de regiones se basa en el operador laplaciano de Gauss LoG en ingles Dada una imagen de entrada f x y displaystyle f x y esa imagen esta convuelta por un kernel Gaussiano g x y t 1 2 p t e x 2 y 2 2 t displaystyle g x y t frac 1 2 pi t e x 2 y 2 2t a una determinada escala t displaystyle t para dar una representacion escala espacio 1 L x y t g x y t f x y displaystyle L x y t g x y t f x y Asi el operador laplaciano viene dado por 2 L L x x L y y displaystyle nabla 2 L L xx L yy Y normalmente da una fuerte respuesta positiva para regiones oscuras de extension t displaystyle sqrt t y negativa para regiones claras de tamano similar El principal problema al aplicar este operador a escala unica es que su respuesta es muy dependiente de la relacion entre el tamano de la region y el tamano del kernel Gaussiano usado para preparar la imagen Para detectar automaticamente regiones de tamano desconocido es necesaria una aproximacion a varias escalas Una manera sencilla de obtener esta aproximacion es considerar el laplaciano de escala normalizada n o r m 2 L x y t t L x x L y y displaystyle nabla norm 2 L x y t t L xx L yy y detectar los maximos minimos de la representacion escala espacio que son puntos simultaneamente maximos minimos locales de n o r m 2 L displaystyle nabla norm 2 L con respecto tanto a espacio como escala Lindeberg 1994 1998 Por tanto dada una imagen discreta en dos dimensiones f x y displaystyle f x y se forma una imagen 3D discreta escala espacio de volumen L x y t displaystyle L x y t y un punto se considera como una region clara si el valor en ese punto es mayor que el valor en sus 24 vecinos y menor para regiones oscuras Asi pues selecciones simultaneas de puntos de interes x y displaystyle hat x hat y y escalas t displaystyle hat t se llevan a cabo conforme a x y t argmaxminlocal x y t n o r m 2 L x y t displaystyle hat x hat y hat t operatorname argmaxminlocal x y t nabla norm 2 L x y t Esta interpretacion de la region proporciona una definicion matematica precisa de lo que entendemos por region que nos lleva a un algoritmo eficiente y robusto para la deteccion de regiones Algunas propiedades basicas de estas regiones son que las respuestas son covariantes con su traslado rotacion y re escalado en el dominio de la imagen Asi pues si un maximo de la escala espacio se encuentra en el punto x 0 y 0 t 0 displaystyle x 0 y 0 t 0 entonces al redimensionar la imagen bajo una escala de factor s displaystyle s habra un maximo de la escala espacio en s x 0 s y 0 s 2 t 0 displaystyle sx 0 sy 0 s 2 t 0 de la imagen redimensionada Lindeberg 1998 Esta propiedad es de gran utilidad en la practica y se usa tambien para la seleccion de escala en otros contextos como la deteccion de esquinas y el reconocimiento de objetos La diferencia Gaussiana EditarPartiendo de que la representacion escala espacio L x y t displaystyle L x y t cumple la ecuacion de la difusion t L 1 2 2 L displaystyle partial t L frac 1 2 nabla 2 L sabemos que el laplaciano de Gauss 2 L x y t displaystyle nabla 2 L x y t se puede obtener como el limite de la diferencia entre dos imagenes suavizadas Gaussianamente 2 L x y t 1 2 D t L x y t D t L x y t D t displaystyle nabla 2 L x y t frac 1 2 Delta t left L x y t Delta t L x y t Delta t right En la vision artificial a esto se le denomina Diferencia de Gauss Salvando las diferencias este operador es muy similar al Laplaciano y se puede ver como una aproximacion del operador Laplaciano El determinante del Hessiano EditarSi consideramos el determinante del Hessiano a escala normalizada tambien llamado operador Monge Ampere det H L x y t t 2 L x x L y y L x y 2 displaystyle operatorname det HL x y t t 2 L xx L yy L xy 2 donde H L displaystyle HL denota la matriz Hessiana de L displaystyle L y calculamos los maximos de la funcion se obtiene otro detector diferencial de regiones con seleccion automatica de escala x y t argmaxlocal x y t det H L x y t displaystyle hat x hat y hat t operatorname argmaxlocal x y t operatorname det HL x y t Los puntos de la region x y displaystyle hat x hat y y escalas t displaystyle hat t vienen tambien definidos por una operacion geometrica diferencial que nos conduce a descriptores de regiones covariantes al traslado rotado y reescalado de la imagen En terminos de seleccion de escala las regiones definidas por maximos del determinante de Hessiano tambien tienen mejores propiedades de seleccion de escala bajo transformaciones afines no Euclideas El hibrido Laplaciano y determinante del Hessiano Hessian Laplace operator EditarSe ha propuesto un operador hibrido entre el Laplaciano y el determinante del Hessiano que realiza la seleccion espacial mediante el determinante del Hessiano y la escala mediante el Laplaciano Mikolajczyk and Schmid 2004 x y argmaxminlocal x y det H L x y t displaystyle hat x hat y operatorname argmaxminlocal x y operatorname det HL x y t t argmaxminlocal t n o r m 2 L x y t displaystyle hat t operatorname argmaxminlocal t nabla norm 2 L hat x hat y t Este operador ha sido usado para deteccion de imagenes reconocimiento de objetos y analisis de texturas Detectores diferenciales de regiones para transformaciones afines EditarLos descriptores de regiones obtenidos mediante estos detectores con seleccion automatica de escala no varian con el traslado rotado y redimensionado uniforme de la imagen en el dominio espacial Las imagenes que recibe un sistema de vision artificial son sin embargo susceptibles a distorsiones de perspectiva Para obtener descriptores de regiones mas robustos a estas distorsiones es necesario crear detectores invariantes a transformaciones afines En la practica puntos invariantes afines se pueden obtener aplicando una adaptacion de forma afin a un descriptor de region donde la forma del kernel de alisado es deformada reiteradamente para ajustarse a la estructura de la imagen o lo que es lo mismo una imagen de ajuste se va deformando mientras la forma del kernel de alisado se mantiene rotacionalmente simetrica Lindeberg and Garding 1997 Baumberg 2000 Mikolajczyk and Schmid 2004 Lindeberg 2008 2009 De esta forma podemos definir una version adaptada a transformaciones afines del operador Laplaciano Diferencia de Gauss el determinante del Hessiano y el operador Hessiano Laplaciano ver Harris Affine 2 y Hessian Affine 3 Regiones en escala de grises arboles y regiones escala espacio EditarUna forma natural de detectar regiones es asociar maximos locales con areas claras y minimos con areas oscuras El inconveniente de esto es que los extremos locales son muy sensibles al ruido Para solventar esto Lindeberg 1993 1994 estudio el problema de detectar maximos locales con extension a multiples escalas Una region con extension espacial se asocia con cada maximo local Un extremo local con extension definida de esta forma se considera una region en escala de grises Ademas se define un arbol de regiones en escala de grises para capturar la estructura topologica anidada de los niveles de intensidad del paisaje de manera que es invariante a las deformaciones afines en el dominio de la imagen y a las transformaciones de intensidad monotonas Estudiando como evolucionan estas estructuras a escalas crecientes aparece la idea de regiones escala espacio Se propuso que las regiones de interes y los descriptores de escala obtenidos por esta via junto con escalas de niveles asociadas y definidas de las escalas de las que se normalizaron las medidas de la dureza de la region que asumieron su maximo en las escalas se pudieran usar para guiar otros procesados visuales Lindeberg desarrollo un algoritmo para detectar regiones en escala de grises que se sigue usando y puede ser consultado aqui 4 asi como algoritmos derivados del mismo 5 Vease tambien EditarDeteccion de esquinas Deteccion de bordes Deteccion de puntos de interesReferencias Editar en Scale space en Harris Affine en Hessian Affine http www csc kth se tony abstracts CVAP84 html en Blob detection Lindeberg 27s watershed based grey level blob detection algorithmBibliografia EditarChristopher Evans Notes on the OpenSURF library Archivado desde el original el 3 de noviembre de 2015 Consultado el 26 de abril de 2010 H Bay T Tuytelaars and L van Gool 2006 SURF Speeded Up Robust Features Proceedings of the 9th European Conference on Computer Vision Springer LNCS volume 3951 part 1 pp 404 417 L Bretzner and T Lindeberg 1998 Feature Tracking with Automatic Selection of Spatial Scales abstract page Computer Vision and Image Understanding 71 pp 385 392 doi 10 1006 cviu 1998 0650 T Lindeberg 1993 Detecting Salient Blob Like Image Structures and Their Scales with a Scale Space Primal Sketch A Method for Focus of Attention abstract page International Journal of Computer Vision 11 3 pp 283 318 doi 10 1007 BF01469346 T Lindeberg 1994 Scale Space Theory in Computer Vision Springer ISBN 0 7923 9418 6 T Lindeberg 1998 Feature detection with automatic scale selection abstract page International Journal of Computer Vision 30 2 pp 77 116 T Lindeberg and J Garding 1997 Shape adapted smoothing in estimation of 3 D depth cues from affine distortions of local 2 D structure International Journal of Computer Vision 15 pp 415 434 T Lindeberg 2008 2009 Scale space Encyclopedia of Computer Science and Engineering Benjamin Wah ed John Wiley and Sons IV 2495 2504 doi 10 1002 9780470050118 ecse609 D G Lowe 2004 Distinctive Image Features from Scale Invariant Keypoints International Journal of Computer Vision 60 2 pp 91 110 doi 10 1023 B VISI 0000029664 99615 94 J Matas O Chum M Urban and T Pajdla 2002 Robust wide baseline stereo from maximally stable extremum regions British Machine Vision Conference pp 384 393 K Mikolajczyk K and C Schmid 2004 Scale and affine invariant interest point detectors Integration of the multi scale Harris operator with the methodology for automatic scale selection as well as with affine shape adaptation International Journal of Computer Vision 60 1 pp 63 86 doi 10 1023 B VISI 0000027790 02288 f2 Datos Q1026711Obtenido de https es wikipedia org w index php title Reconocimiento de regiones amp oldid 133452027, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos