fbpx
Wikipedia

Query by Humming

El query by humming (en español "búsqueda por tarareo") es la recuperación de una canción mediante el "zumbido" o "tarareo" del tono o de la melodía de la canción, y la comparación con patrones previamente almacenados en la base de datos. En las nuevas generaciones de bases de datos, las cuales incluyen audio, imágenes, video y texto, es importante tener nuevos métodos (más apropiados y más naturales) de búsqueda, es así como por ejemplo en imágenes se pueden buscar estas por su forma, color, etc.

Introducción

El sistema depende de la observación del contorno melódico de la canción, el cual es definido como la secuencia de la diferencia relativa de las alturas (pitch) en las notas sucesivas. Según Stephen Andel del MIT, el contorno melódico es una de las características más importantes usadas por las personas para determinar las similitudes entre melodías.

Se usa un alfabeto de tres letras de acuerdo a las posibles relaciones entre alturas (pitches). U, D, S; se usan si la nota esta por encima, por debajo o es la misma de la nota inmediatamente anterior. El sistema está dividido en un Pitch tracking (que hace el rastreo del tono), una base de datos con las melodías almacenadas y un motor de búsqueda.

La melodía "tarareada" es captada por el micrófono, luego se digitalizará, y pasará al módulo de pitch tracking. El resultado es un contorno que representa la melodía de entrada, la cual entra a un motor de búsqueda que arroja una lista ranqueada con las melodías coincidentes. La comparación se hace con melodías MIDI de dominio público, las cuales se procesan para extraer las notas de la melodía. El sistema para extraer el pitch, o notas musicales es implementado en MATLAB, y el motor de búsqueda usa un algoritmo por Approximate Pattern Matching para soportar errores en el humming (tarareo).

Uno de los sistemas implementados por Query by Humming convierte la entrada de usuario en una secuencia de transiciones relativas de la altura. Una nota en la entrada es clasificada de tres formas; S, si es igual a la nota anterior; U, si es más alta que la nota previa, y D si es más baja. Es así como la entrada es convertida en una cadena formada con la combinación de esas tres letras. Como ejemplo una melodía cualquiera podría ser convertida a una cadena – S S D U S S D; el primer tono se ignora ya que no hay nota con que compararlo.

Luego de que la cadena de caracteres es organizada, existe el problema de la afinación ya que no se sabe con certeza que nota (pitch) está contenida en la cadena. Para esto se usa la función de transferencia del tracto vocal.

Aplicaciones

Algunas aplicaciones de un sistema QbH (Query by Humming) pueden ser:

  • Búsqueda y/o recuperación de canciones con artista o título desconocido.
  • Encontrar melodías similares entre sí en canciones diferentes.
  • Actualización de las bases de datos.

El sistema se puede implementar en tiendas de discos y librerías musicales.

Productos comerciales

  • Queryhammer, basado en MATLAB y usando el estándar MPEG-7.
  • Sloud, el cual es un applet ActiveX. Este complemento usa algoritmos de búsqueda difusos lo cual permite un rango de errores e imprecisiones en el canto. El éxito de la búsqueda depende de las habilidades para el canto, y para mejores resultados no se debe cantar con la letra de la canción, simplemente se "tararea" la melodía con sílabas "DA DA DA", la interfaz de usuario comprende una ventana de colores, entre más uniformes sean los colores, mejor están siendo identificados los tonos.
  • A Tarter 2003, un applet que usa una base de datos de 10000 midis para cotejar la melodía, la cual es grabada directamente del navegador web. También se puede entrar la melodía por teclado MIDI.

Grupos de investigación

The Working Group For Electronic Media Technology (AEMT) de la sociedad Fraunhofer en Ilmenau, Alemania; trabaja en diferentes campos del MIR, desde el manejo de metadatos (artista, título, tempo, etc), hasta el desarrollo del software "Query By Humming"; liderados por el Dr. Frank Klefenz.

El trabajo del instituto es resultado de la evolución del MP3, creado por ellos. En otro lado del Instituto Fraunhofer, en el Institute for integrated Circuits IIS, se trabaja en proyecto AudioID, el cual registra todas las características musicales de la canción, incluso diferencia entre versiones de la canción, y está basado en la tecnología MPEG7. Esto es de gran aplicación en tiendas de música, difusión, y protección de derechos de autor.

El College of Information Science and Technology (IST), en la PENN State, Pennsylvania, actualmente se trabaja en proyectos de QbH orientados únicamente a MP3, los cuales son más difíciles de tratar. "A New Spectral Based Approach To Query By Humming For MP3 Songs Database" está basado el filtrado de la señal, procesamiento espectral (sub band), análisis por coeficientes MDCT y detección de energía pico para ignorar la música de fondo lo más posible; y finalmente un algoritmo de comparación para arrojar los resultados.

En la Universidad de Cornell, en Nueva York, Asif Ghias, Johnatan Logan, David Chamberlin y Brian Smith investigan y desarrollaron un sistema de QbH basados en algoritmos de pitch tracking, y alimentado la base de datos con melodías MIDI.

Charles Parker, del grupo de investigación de computación de la Universidad de Oregon State, en Corvallis, Oregón; desarrolló un método que usa técnicas de inteligencia artificial para solucionar el problema computacional de los algoritmos de QbH en su trabajo llamado "Applications of Binary Classification and Adaptive Boosting to the Query By Humming Problem".

Enlaces externos

Aplicaciones en línea

  • Midomi
  • SoundHound (app móvil)
  • QbH system de Musipedia
  • ,
  • (en alemán)
  • MaART en Sourceforge
  • Tunebot de la Universidad Northwestern

Referencias

  • Tecnologías audiovisuales (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  • Aplicaciones del Query by Humming
  •   Datos: Q1550553

query, humming, query, humming, español, búsqueda, tarareo, recuperación, canción, mediante, zumbido, tarareo, tono, melodía, canción, comparación, patrones, previamente, almacenados, base, datos, nuevas, generaciones, bases, datos, cuales, incluyen, audio, im. El query by humming en espanol busqueda por tarareo es la recuperacion de una cancion mediante el zumbido o tarareo del tono o de la melodia de la cancion y la comparacion con patrones previamente almacenados en la base de datos En las nuevas generaciones de bases de datos las cuales incluyen audio imagenes video y texto es importante tener nuevos metodos mas apropiados y mas naturales de busqueda es asi como por ejemplo en imagenes se pueden buscar estas por su forma color etc Indice 1 Introduccion 2 Aplicaciones 3 Productos comerciales 4 Grupos de investigacion 5 Enlaces externos 5 1 Aplicaciones en linea 5 2 ReferenciasIntroduccion EditarEl sistema depende de la observacion del contorno melodico de la cancion el cual es definido como la secuencia de la diferencia relativa de las alturas pitch en las notas sucesivas Segun Stephen Andel del MIT el contorno melodico es una de las caracteristicas mas importantes usadas por las personas para determinar las similitudes entre melodias Se usa un alfabeto de tres letras de acuerdo a las posibles relaciones entre alturas pitches U D S se usan si la nota esta por encima por debajo o es la misma de la nota inmediatamente anterior El sistema esta dividido en un Pitch tracking que hace el rastreo del tono una base de datos con las melodias almacenadas y un motor de busqueda La melodia tarareada es captada por el microfono luego se digitalizara y pasara al modulo de pitch tracking El resultado es un contorno que representa la melodia de entrada la cual entra a un motor de busqueda que arroja una lista ranqueada con las melodias coincidentes La comparacion se hace con melodias MIDI de dominio publico las cuales se procesan para extraer las notas de la melodia El sistema para extraer el pitch o notas musicales es implementado en MATLAB y el motor de busqueda usa un algoritmo por Approximate Pattern Matching para soportar errores en el humming tarareo Uno de los sistemas implementados por Query by Humming convierte la entrada de usuario en una secuencia de transiciones relativas de la altura Una nota en la entrada es clasificada de tres formas S si es igual a la nota anterior U si es mas alta que la nota previa y D si es mas baja Es asi como la entrada es convertida en una cadena formada con la combinacion de esas tres letras Como ejemplo una melodia cualquiera podria ser convertida a una cadena S S D U S S D el primer tono se ignora ya que no hay nota con que compararlo Luego de que la cadena de caracteres es organizada existe el problema de la afinacion ya que no se sabe con certeza que nota pitch esta contenida en la cadena Para esto se usa la funcion de transferencia del tracto vocal Aplicaciones EditarAlgunas aplicaciones de un sistema QbH Query by Humming pueden ser Busqueda y o recuperacion de canciones con artista o titulo desconocido Encontrar melodias similares entre si en canciones diferentes Actualizacion de las bases de datos El sistema se puede implementar en tiendas de discos y librerias musicales Productos comerciales EditarQueryhammer basado en MATLAB y usando el estandar MPEG 7 Sloud el cual es un applet ActiveX Este complemento usa algoritmos de busqueda difusos lo cual permite un rango de errores e imprecisiones en el canto El exito de la busqueda depende de las habilidades para el canto y para mejores resultados no se debe cantar con la letra de la cancion simplemente se tararea la melodia con silabas DA DA DA la interfaz de usuario comprende una ventana de colores entre mas uniformes sean los colores mejor estan siendo identificados los tonos A Tarter 2003 un applet que usa una base de datos de 10000 midis para cotejar la melodia la cual es grabada directamente del navegador web Tambien se puede entrar la melodia por teclado MIDI Grupos de investigacion EditarThe Working Group For Electronic Media Technology AEMT de la sociedad Fraunhofer en Ilmenau Alemania trabaja en diferentes campos del MIR desde el manejo de metadatos artista titulo tempo etc hasta el desarrollo del software Query By Humming liderados por el Dr Frank Klefenz El trabajo del instituto es resultado de la evolucion del MP3 creado por ellos En otro lado del Instituto Fraunhofer en el Institute for integrated Circuits IIS se trabaja en proyecto AudioID el cual registra todas las caracteristicas musicales de la cancion incluso diferencia entre versiones de la cancion y esta basado en la tecnologia MPEG7 Esto es de gran aplicacion en tiendas de musica difusion y proteccion de derechos de autor El College of Information Science and Technology IST en la PENN State Pennsylvania actualmente se trabaja en proyectos de QbH orientados unicamente a MP3 los cuales son mas dificiles de tratar A New Spectral Based Approach To Query By Humming For MP3 Songs Database esta basado el filtrado de la senal procesamiento espectral sub band analisis por coeficientes MDCT y deteccion de energia pico para ignorar la musica de fondo lo mas posible y finalmente un algoritmo de comparacion para arrojar los resultados En la Universidad de Cornell en Nueva York Asif Ghias Johnatan Logan David Chamberlin y Brian Smith investigan y desarrollaron un sistema de QbH basados en algoritmos de pitch tracking y alimentado la base de datos con melodias MIDI Charles Parker del grupo de investigacion de computacion de la Universidad de Oregon State en Corvallis Oregon desarrollo un metodo que usa tecnicas de inteligencia artificial para solucionar el problema computacional de los algoritmos de QbH en su trabajo llamado Applications of Binary Classification and Adaptive Boosting to the Query By Humming Problem Enlaces externos EditarAplicaciones en linea Editar Midomi SoundHound app movil QbH system de Musipedia Proyecto de investigacion QbH en NYU Query by Humming de Sloud Inc QbH applet Active X Musicline QbH basado en tecnologia de Fraunhofer Institut en aleman MaART en Sourceforge Tunebot de la Universidad NorthwesternReferencias Editar Concepto y especificacion para melodias Tecnologias audiovisuales enlace roto disponible en Internet Archive vease el historial la primera version y la ultima Articulo sobre el Query by Humming Aplicaciones del Query by Humming Datos Q1550553Obtenido de https es wikipedia org w index php title Query by Humming amp oldid 126495585, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos