fbpx
Wikipedia

Descriptores visuales

Los descriptores visuales describen las características visuales de los contenidos dispuestos en imágenes o en vídeos. Describen características elementales tales como la forma, el color, la textura o el movimiento, entre otros.

Introducción

Como consecuencia de las nuevas tecnologías de comunicación y al uso masivo de Internet en la sociedad actual, la cantidad de información audiovisual disponible en formato digital está alcanzando cifras realmente elevadas. Es por ese motivo que ha sido preciso diseñar sistemas que nos permitan describir el contenido de varios tipos de información multimedia para poderlos buscar y clasificar.

Los encargados de describir el contenido son los llamados descriptores audiovisuales. Estos tienen un buen conocimiento de los objetos y eventos presentes en un vídeo, imagen o audio y permiten la búsqueda rápida y eficiente de dicho contenido audiovisual.

Este sistema se puede comparar con los buscadores de contenido textual. Si bien es cierto que es relativamente fácil encontrar texto con un ordenador, resulta mucho más difícil encontrar partes concretas de audio y vídeo. Por ejemplo, imaginemos alguien buscando una escena de una persona feliz. La felicidad es un sentimiento y no es evidente la descripción de su forma, color y textura en las imágenes.

La descripción del contenido audiovisual no es una tarea superficial y es esencial para la utilización eficaz de este tipo de archivos. El sistema de estandarización por excelencia que explota los descriptores audiovisuales es el MPEG-7 (Motion Picture Expert Group - 7).

Tipos de descriptores visuales

Los descriptores son el primer paso para poder encontrar la conexión entre los píxeles contenidos en una imagen digital y aquello que los humanos recordamos después de haber observado durante unos minutos una imagen o un conjunto de las mismas.

Los descriptores visuales se dividen en dos grandes grupos:

  1. Descriptores de información general: contienen descriptores de bajo nivel, proporcionando una descripción a cerca del color, formas y regiones, texturas y movimiento.
  2. Descriptores de información de dominio específico: proporcionan información acerca de los objetos y eventos que van apareciendo en la escena. Un ejemplo muy concreto seria el de reconocimiento facial.

Descriptores de información general

Los descriptores de información general consisten en descriptores que cubren distintas características visuales básicas y elementales como son: el color, textura, forma, movimiento y localización, entre otras. La descripción es generada automáticamente mediante procesamiento digital de señales.

  • Color: es la cualidad más básica del contenido visual. Se definen cinco herramientas para describir el color. Las tres primeras herramientas representan la distribución del color. Las dos restantes herramientas, una describe la distribución espacial del color y la última describe la relación del color entre una secuencia o conjunto de imágenes:
    • Dominant Color Descriptor (DCD)
    • Scalable Color Descriptor (SCD)
    • Color Structure Descriptor (CSD)
    • Color Layout Descriptor (CLD)
    • Group of frame (GoF) o Group-of-pictures (GoP)
  • Textura: es otra cualidad muy importante para describir una imagen. Se diseña para caracterizar las texturas o regiones de una imagen. Observan la homogeneidad de las regiones y los histogramas de los bordes de dichas regiones. El conjunto de descriptores está formado por:
    • Homogeneous Texture Descriptor (HTD)
    • Texture Browsing Descriptor (TBD)
    • Edge Histogram Descriptor (EHD)
  • Forma: posee una información semántica muy importante, debido a que los humanos somos capaces de reconocer los objetos solo viendo su forma. No obstante, esta información solo puede ser extraída mediante una segmentación similar a la que realiza el sistema visual humano. En la actualidad todavía no está disponible, pero si existen una serie de algoritmos que nos permiten una buena aproximación. Estos descriptores describen las regiones, contornos y formas para imágenes 2D y volúmenes 3D. El conjunto de descriptores está formado por:
    • Region-based Shape Descriptor (RSD)
    • Contour-based Shape Descriptor (CSD)
    • 3-D Shape Descriptor (3-D SD)
  • Movimiento: se define mediante cuatro descriptores que describen el movimiento en las secuencias de vídeo. Este movimiento va asociado a los objetos de la secuencia o bien al movimiento propio de la cámara. Esta última información es proporcionada por el dispositivo de captura, mientras que el resto se realiza con procesamiento digital de señales. El conjunto de descriptores está formado por:
    • Motion Activity Descriptor (MAD)
    • Camera Motion Descriptor (CMD)
    • Motion Trajectory Descriptor (MTD)
    • Warping and Parametric Motion Descriptor (WMD and PMD)
  • LOCALIZACIÓN: de los elementos dentro de una imagen se utiliza para describir elementos en el dominio espacial o temporal dentro de la secuencia de vídeo. Los dos descriptores que lo permiten son los siguientes:
    • Region Locator Descriptor (RLD)
    • Spatio Temporal Locator Descriptor (STLD)

Descriptores de información de dominio específico

Estos descriptores, que proporcionan información sobre objetos y eventos en la escena, no son fáciles de extraer, aún más si se pretende realizar una extracción automática. Sin embargo, siempre cabe la posibilidad, aunque ardua, de realizar un procesado manual.

Tal y como se ha mencionado anteriormente, un ejemplo concreto de una aplicación que intenta extraer este tipo de información de forma automática sería el de reconocimiento facial.

Aplicaciones de los descriptores

Entre todas sus aplicaciones, las más relevantes son:

  • Buscadores y clasificadores de documentos multimedia.
  • Bibliotecas Digitales. Permite una búsqueda muy detallada y concreta de cualquier vídeo o imagen, mediante diferentes tipos de parámetros de búsqueda: desde la búsqueda de la última película donde salga un actor conocido, hasta buscar todos los vídeos donde salga la montaña Everest.
  • Servicio de noticias electrónicas personalizado.
  • Posibilidad de una conexión automática a un canal de televisión, que esté emitiendo un partido de fútbol, cada vez que un jugador se acerque al área de gol, por ejemplo.
  • Filtrado y control de cierto contenido audiovisual. Por ejemplo material violento o pornográfico no apto para ciertas personas. Y también autorización para algunos contenidos multimedia.

Véase también

Referencias

  • B.S. Manjunath (Editor), Philippe Salembier (Editor), and Thomas Sikora (Editor): Introduction to MPEG-7: Multimedia Content Description Interface. Wiley & Sons, April 2002 - ISBN 0-471-48678-7

Enlaces externos

  • Multimedia Content Analysis Using both Audio and Video Clues PDF (en inglés)
  • Relating Visual and Semantic Image Descriptors
  • Fusing MPEG-7 visual descriptors for image classication
  • MPEG-7 Quick Reference
  •   Datos: Q4894627

descriptores, visuales, descriptores, visuales, describen, características, visuales, contenidos, dispuestos, imágenes, vídeos, describen, características, elementales, tales, como, forma, color, textura, movimiento, entre, otros, Índice, introducción, tipos, . Los descriptores visuales describen las caracteristicas visuales de los contenidos dispuestos en imagenes o en videos Describen caracteristicas elementales tales como la forma el color la textura o el movimiento entre otros Indice 1 Introduccion 2 Tipos de descriptores visuales 2 1 Descriptores de informacion general 2 2 Descriptores de informacion de dominio especifico 3 Aplicaciones de los descriptores 4 Vease tambien 5 Referencias 6 Enlaces externosIntroduccion EditarComo consecuencia de las nuevas tecnologias de comunicacion y al uso masivo de Internet en la sociedad actual la cantidad de informacion audiovisual disponible en formato digital esta alcanzando cifras realmente elevadas Es por ese motivo que ha sido preciso disenar sistemas que nos permitan describir el contenido de varios tipos de informacion multimedia para poderlos buscar y clasificar Los encargados de describir el contenido son los llamados descriptores audiovisuales Estos tienen un buen conocimiento de los objetos y eventos presentes en un video imagen o audio y permiten la busqueda rapida y eficiente de dicho contenido audiovisual Este sistema se puede comparar con los buscadores de contenido textual Si bien es cierto que es relativamente facil encontrar texto con un ordenador resulta mucho mas dificil encontrar partes concretas de audio y video Por ejemplo imaginemos alguien buscando una escena de una persona feliz La felicidad es un sentimiento y no es evidente la descripcion de su forma color y textura en las imagenes La descripcion del contenido audiovisual no es una tarea superficial y es esencial para la utilizacion eficaz de este tipo de archivos El sistema de estandarizacion por excelencia que explota los descriptores audiovisuales es el MPEG 7 Motion Picture Expert Group 7 Tipos de descriptores visuales EditarLos descriptores son el primer paso para poder encontrar la conexion entre los pixeles contenidos en una imagen digital y aquello que los humanos recordamos despues de haber observado durante unos minutos una imagen o un conjunto de las mismas Los descriptores visuales se dividen en dos grandes grupos Descriptores de informacion general contienen descriptores de bajo nivel proporcionando una descripcion a cerca del color formas y regiones texturas y movimiento Descriptores de informacion de dominio especifico proporcionan informacion acerca de los objetos y eventos que van apareciendo en la escena Un ejemplo muy concreto seria el de reconocimiento facial Descriptores de informacion general Editar Los descriptores de informacion general consisten en descriptores que cubren distintas caracteristicas visuales basicas y elementales como son el color textura forma movimiento y localizacion entre otras La descripcion es generada automaticamente mediante procesamiento digital de senales Color es la cualidad mas basica del contenido visual Se definen cinco herramientas para describir el color Las tres primeras herramientas representan la distribucion del color Las dos restantes herramientas una describe la distribucion espacial del color y la ultima describe la relacion del color entre una secuencia o conjunto de imagenes Dominant Color Descriptor DCD Scalable Color Descriptor SCD Color Structure Descriptor CSD Color Layout Descriptor CLD Group of frame GoF o Group of pictures GoP Textura es otra cualidad muy importante para describir una imagen Se disena para caracterizar las texturas o regiones de una imagen Observan la homogeneidad de las regiones y los histogramas de los bordes de dichas regiones El conjunto de descriptores esta formado por Homogeneous Texture Descriptor HTD Texture Browsing Descriptor TBD Edge Histogram Descriptor EHD Forma posee una informacion semantica muy importante debido a que los humanos somos capaces de reconocer los objetos solo viendo su forma No obstante esta informacion solo puede ser extraida mediante una segmentacion similar a la que realiza el sistema visual humano En la actualidad todavia no esta disponible pero si existen una serie de algoritmos que nos permiten una buena aproximacion Estos descriptores describen las regiones contornos y formas para imagenes 2D y volumenes 3D El conjunto de descriptores esta formado por Region based Shape Descriptor RSD Contour based Shape Descriptor CSD 3 D Shape Descriptor 3 D SD Movimiento se define mediante cuatro descriptores que describen el movimiento en las secuencias de video Este movimiento va asociado a los objetos de la secuencia o bien al movimiento propio de la camara Esta ultima informacion es proporcionada por el dispositivo de captura mientras que el resto se realiza con procesamiento digital de senales El conjunto de descriptores esta formado por Motion Activity Descriptor MAD Camera Motion Descriptor CMD Motion Trajectory Descriptor MTD Warping and Parametric Motion Descriptor WMD and PMD LOCALIZACIoN de los elementos dentro de una imagen se utiliza para describir elementos en el dominio espacial o temporal dentro de la secuencia de video Los dos descriptores que lo permiten son los siguientes Region Locator Descriptor RLD Spatio Temporal Locator Descriptor STLD Descriptores de informacion de dominio especifico Editar Estos descriptores que proporcionan informacion sobre objetos y eventos en la escena no son faciles de extraer aun mas si se pretende realizar una extraccion automatica Sin embargo siempre cabe la posibilidad aunque ardua de realizar un procesado manual Tal y como se ha mencionado anteriormente un ejemplo concreto de una aplicacion que intenta extraer este tipo de informacion de forma automatica seria el de reconocimiento facial Aplicaciones de los descriptores EditarEntre todas sus aplicaciones las mas relevantes son Buscadores y clasificadores de documentos multimedia Bibliotecas Digitales Permite una busqueda muy detallada y concreta de cualquier video o imagen mediante diferentes tipos de parametros de busqueda desde la busqueda de la ultima pelicula donde salga un actor conocido hasta buscar todos los videos donde salga la montana Everest Servicio de noticias electronicas personalizado Posibilidad de una conexion automatica a un canal de television que este emitiendo un partido de futbol cada vez que un jugador se acerque al area de gol por ejemplo Filtrado y control de cierto contenido audiovisual Por ejemplo material violento o pornografico no apto para ciertas personas Y tambien autorizacion para algunos contenidos multimedia Vease tambien EditarMPEG 7 Sistema de reconocimiento facialReferencias EditarB S Manjunath Editor Philippe Salembier Editor and Thomas Sikora Editor Introduction to MPEG 7 Multimedia Content Description Interface Wiley amp Sons April 2002 ISBN 0 471 48678 7Enlaces externos EditarMultimedia Content Analysis Using both Audio and Video Clues 1 PDF en ingles Relating Visual and Semantic Image Descriptors 2 Fusing MPEG 7 visual descriptors for image classication 3 MPEG 7 Quick Reference 4 Datos Q4894627Obtenido de https es wikipedia org w index php title Descriptores visuales amp oldid 131406136, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos