fbpx
Wikipedia

Descriptores de audio del MPEG-7

El MPEG-7 es un estándar que permite la indexación audiovisual. Dentro del estándar hay una parte dedicada al tratamiento de la información de audio, permitiendo conocer las características de la señal gracias a los descriptores. En este artículo nos centraremos en los descriptores de audio del MPEG-7, que nos darán información sobre como es la señal. Como en los descriptores visuales, los descriptores de audio podemos dividirlos en dos grandes grupos: descriptores de bajo nivel y alto nivel (herramientas específicas).


Descriptores de bajo nivel

El objetivo de estos descriptores es proporcionar la información básica de la señal para poder definir herramientas específicas de nivel superior. El método de adquisición de dicha información puede ser la extracción de las características de una serie de intervalos regulares o de segmentos arbitrarios. En general podremos dividir los descriptores de bajo nivel en los siguientes grupos:

Básicos

Estos ofrecen un valor mínimo y máximo de la amplitud de la señal de audio en el periodo de muestreo, que nos permite la visualización de la onda de sonido (descriptor AudioWaveformType), o bien definen la potencia de las muestras de la señal de audio (descriptor AudioPowerType).

Espectrales básicos

Describen el contenido espectral de la señal y reflejan la respuesta del oído humano (aproximadamente logarítmica). Dicho espectro es caracterizado por el descriptor AudioSpectrumEnvelopeType y calculado a partir de la FFT. Como complemento al AudioSpectrumEnvelopeType existen otros descriptores que nos proporcionan otras características: AudioSpectrumCentroidType, indica si el espectro está dominado por altas o bajas frecuencias. AudioSpectrumSpreadType, indica la forma de la energía del espectro y donde se concentra. AudioSpectrumFlatnessType, indica lo plano que es el espectro para cada banda de frecuencia.

Parámetros de señal

El cálculo de estos parámetros se sujeta a la estimación y pueden describir el detalle del espectro en términos de estructura armónica. Uno de los parámetros que podemos calcular es la frecuencia fundamental, para la cual no hay ninguna normal que marque el mecanismo de cálculo del descriptor AudioFundamentalFrequencyType. Otro descriptor es el AudioHarmonicityType. Nos va a dar medidas armónicas de la naturaleza de la señal del espectro gracias a dos medidas: HarmonicRatio (medida de la proporción de componentes armónicos de energía en el espectro) y UpperLimitOfHarmonicity (punto del espectro a partir del cual no tenemos armónicos).

Timbre temporal

Se utilizan para el cálculo, únicamente dentro de un segmento de audio, de los parámetros de la envolvente de la señal. Los descriptores son: LogAttackTimeType y TemporalCentroid.

Timbre espectral

Se pueden utilizar para dar más caracterización a la señal. Se complementan con los descriptores básicos y amplían las posibilidades ofrecidas por los descriptores de parámetro de señal.

Representaciones del espectro base

Ofrece herramientas para proyectar una señal de audio del espectro en una baja representación tridimensional.

Segmento silencio

Herramienta sencilla que nos indica si hay silencio en un segmento de audio.


Descriptores de alto nivel

El objetivo de estos descriptores es proporcionar información más avanzada sobre la señal, teniendo en cuenta las características básicas de dicha señal. En la actualidad se está investigando sobre estos descriptores de alto nivel ya que no están acabados de desarrollar.

Herramientas de reconocimiento general de sonido e indexación

Las herramientas de reconocimiento general del sonido sirven para indexar y clasificar los efectos sonoros y los sonidos en general.

Herramientas de descripción del contenido hablado

La descripción del contenido parte de la imperfección de los actuales sistemas de reconocimiento de voz y consiste en la combinación de palabras y enrejados telefónicos.

Herramientas de descripción del tono de un instrumento musical

Describe las características de percepción de un instrumento de sonido. Estos descriptores se refieren a conceptos como ataque, brillo o riqueza de un sonido.

Herramientas de descripción de la melodía

Incluye una amplia representación de la información melódica monofónica para facilitar la eficiencia, robustez y similitud.

Enlaces de Interés

  • Estándar MPEG-7 el 11 de diciembre de 2007 en Wayback Machine.
  • MPEG-7 Multimedia Software Resources by Michael Casey

Véase también

  •   Datos: Q5803951

descriptores, audio, mpeg, mpeg, estándar, permite, indexación, audiovisual, dentro, estándar, parte, dedicada, tratamiento, información, audio, permitiendo, conocer, características, señal, gracias, descriptores, este, artículo, centraremos, descriptores, aud. El MPEG 7 es un estandar que permite la indexacion audiovisual Dentro del estandar hay una parte dedicada al tratamiento de la informacion de audio permitiendo conocer las caracteristicas de la senal gracias a los descriptores En este articulo nos centraremos en los descriptores de audio del MPEG 7 que nos daran informacion sobre como es la senal Como en los descriptores visuales los descriptores de audio podemos dividirlos en dos grandes grupos descriptores de bajo nivel y alto nivel herramientas especificas Indice 1 Descriptores de bajo nivel 1 1 Basicos 1 2 Espectrales basicos 1 3 Parametros de senal 1 4 Timbre temporal 1 5 Timbre espectral 1 6 Representaciones del espectro base 1 7 Segmento silencio 2 Descriptores de alto nivel 2 1 Herramientas de reconocimiento general de sonido e indexacion 2 2 Herramientas de descripcion del contenido hablado 2 3 Herramientas de descripcion del tono de un instrumento musical 2 4 Herramientas de descripcion de la melodia 3 Enlaces de Interes 4 Vease tambienDescriptores de bajo nivel EditarEl objetivo de estos descriptores es proporcionar la informacion basica de la senal para poder definir herramientas especificas de nivel superior El metodo de adquisicion de dicha informacion puede ser la extraccion de las caracteristicas de una serie de intervalos regulares o de segmentos arbitrarios En general podremos dividir los descriptores de bajo nivel en los siguientes grupos Basicos Editar Estos ofrecen un valor minimo y maximo de la amplitud de la senal de audio en el periodo de muestreo que nos permite la visualizacion de la onda de sonido descriptor AudioWaveformType o bien definen la potencia de las muestras de la senal de audio descriptor AudioPowerType Espectrales basicos Editar Describen el contenido espectral de la senal y reflejan la respuesta del oido humano aproximadamente logaritmica Dicho espectro es caracterizado por el descriptor AudioSpectrumEnvelopeType y calculado a partir de la FFT Como complemento al AudioSpectrumEnvelopeType existen otros descriptores que nos proporcionan otras caracteristicas AudioSpectrumCentroidType indica si el espectro esta dominado por altas o bajas frecuencias AudioSpectrumSpreadType indica la forma de la energia del espectro y donde se concentra AudioSpectrumFlatnessType indica lo plano que es el espectro para cada banda de frecuencia Parametros de senal Editar El calculo de estos parametros se sujeta a la estimacion y pueden describir el detalle del espectro en terminos de estructura armonica Uno de los parametros que podemos calcular es la frecuencia fundamental para la cual no hay ninguna normal que marque el mecanismo de calculo del descriptor AudioFundamentalFrequencyType Otro descriptor es el AudioHarmonicityType Nos va a dar medidas armonicas de la naturaleza de la senal del espectro gracias a dos medidas HarmonicRatio medida de la proporcion de componentes armonicos de energia en el espectro y UpperLimitOfHarmonicity punto del espectro a partir del cual no tenemos armonicos Timbre temporal Editar Se utilizan para el calculo unicamente dentro de un segmento de audio de los parametros de la envolvente de la senal Los descriptores son LogAttackTimeType y TemporalCentroid Timbre espectral Editar Se pueden utilizar para dar mas caracterizacion a la senal Se complementan con los descriptores basicos y amplian las posibilidades ofrecidas por los descriptores de parametro de senal Representaciones del espectro base Editar Ofrece herramientas para proyectar una senal de audio del espectro en una baja representacion tridimensional Segmento silencio Editar Herramienta sencilla que nos indica si hay silencio en un segmento de audio Descriptores de alto nivel EditarEl objetivo de estos descriptores es proporcionar informacion mas avanzada sobre la senal teniendo en cuenta las caracteristicas basicas de dicha senal En la actualidad se esta investigando sobre estos descriptores de alto nivel ya que no estan acabados de desarrollar Herramientas de reconocimiento general de sonido e indexacion Editar Las herramientas de reconocimiento general del sonido sirven para indexar y clasificar los efectos sonoros y los sonidos en general Herramientas de descripcion del contenido hablado Editar La descripcion del contenido parte de la imperfeccion de los actuales sistemas de reconocimiento de voz y consiste en la combinacion de palabras y enrejados telefonicos Herramientas de descripcion del tono de un instrumento musical Editar Describe las caracteristicas de percepcion de un instrumento de sonido Estos descriptores se refieren a conceptos como ataque brillo o riqueza de un sonido Herramientas de descripcion de la melodia Editar Incluye una amplia representacion de la informacion melodica monofonica para facilitar la eficiencia robustez y similitud Enlaces de Interes EditarPagina oficial del grupo MPEG Estandar MPEG 7 Archivado el 11 de diciembre de 2007 en Wayback Machine MPEG 7 Multimedia Software Resources by Michael CaseyVease tambien EditarDescriptores basicos de audio del MPEG 7Descriptores de timbre de audio del MPEG 7MPEG 7Indexacion audiovisual Datos Q5803951Obtenido de https es wikipedia org w index php title Descriptores de audio del MPEG 7 amp oldid 118812461, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos