fbpx
Wikipedia

Modelo Booleano Extendido

El Modelo Booleano Extendido fue presentado en un artículo de Communications of the ACM en el año 1983, por Gerard Salton, Edward A. Fox y Harry Wu. El propósito del Modelo Booleano Extendido es superar las desventajas del Modelo Booleano que ha sido utilizado en recuperación de información. El Modelo Booleano no considera los pesos de los términos en las consultas y el conjunto respuesta de una consulta booleana es con frecuencia demasiado pequeño o demasiado grande. La idea del modelo extendido es hacer uso de la correspondencia parcial y los pesos de los términos del Modelo de Espacio Vectorial, combinándolos con las propiedades del Álgebra Booleana. De esta forma, un documento puede ser un tanto relevante si contiene algunos términos de la consulta, y puede ser obtenido como respuesta, mientras que en el Modelo Booleano esto no ocurre.[1]


Así, el Modelo Booleano Extendido puede ser considerado como una generalización de los modelos Booleano y Vectorial. Además, la investigación ha demostrado mejoras en la efectividad respecto al procesamiento de consultas del Modelo Booleano. Otras investigaciones han mostrado que la retroalimentación y la expansión de consultas pueden ser adaptadas al procesamiento de consultas del Modelo Booleano Extendido.

Definiciones

En el Modelo Booleano Extendido un documento se representa por un vector (al igual que en el Modelo Vectorial). Cada componente corresponde a un término asociado al documento.

El peso del término   asociado al documento   se mide por su frecuencia de término normalizada y puede definirse como:

 

donde   es la frecuencia inversa de documento.

El vector de pesos asociado al documento   puede ser representado como:

 

Ejemplo en 2 Dimensiones

 
Fig. 1: Similitud de la consulta   con los documentos   y  
 
Fig. 2: Similitud de la consulta   con los documentos   y  

Considerando el espacio compuesto por los dos términos   y  , los pesos correspondientes son   y  .[2]​ Así, para la consulta  , podemos calcular la similitud con la siguiente fórmula:

 

Para la consulta  , podemos usar:

 

Generalizando la idea

Podemos generalizar el ejemplo anterior en 2 dimensiones del Modelo Booleano Extendido al espacio t-dimensional usando la distancia Euclidiana.

Esto puede hacerse usando Norma-P, que extiende la noción de distancia para incluir p-distancias, donde   es un nuevo parámetro.[3]

  • Una consulta conjuntiva general está dada por:
 

La similitud de la consulta   y el documento   puede definirse como:

 
  • Una consulta disyuntiva general está dada por:
 

La similitud de la consulta   y el documento   puede definirse como:

 

Ejemplos

Considere la consulta   . La similitud entre la consulta   y el documento   puede calcularse usando la fórmula:

 

Mejoras respecto al Modelo Booleano

Lee y Fox[4]​ compararon los modelos Booleano y Booleano Extendido con tres colecciones de prueba, CISI, CACM e INSPEC.

Utilizando Norma-P se obtuvo un promedio de mejoras en la precisión de 79%, 106% y 210% respecto al Modelo Booleano estándar, para las colecciones CISI, CACM e INSPEC, respectivamente.

El modelo de Norma-P es computacionalmente costoso por el número de operaciones de exponenciación que requiere; sin embargo, logra resultados mucho mejores que el Modelo Booleano, e incluso que el Modelo Fuzzy. El Modelo Booleano estándar es, no obstante, el más eficiente.

Véase también

Bibliografía

  1. Salton, Gerard; Edward A. Fox, Harry Wu (1983), Extended Boolean information retrieval, Communications of the ACM, Volume 26, Issue 11  .
  2. Garcia, Dr. E., , archivado desde el original el 29 de mayo de 2010 .
  3. Lee, W. C.; E. A. Fox (1988), Experimental Comparison of Schemes for Interpreting Boolean Queries  .

Enlaces externos

  •   Datos: Q796230

modelo, booleano, extendido, presentado, artículo, communications, año, 1983, gerard, salton, edward, harry, propósito, superar, desventajas, modelo, booleano, sido, utilizado, recuperación, información, modelo, booleano, considera, pesos, términos, consultas,. El Modelo Booleano Extendido fue presentado en un articulo de Communications of the ACM en el ano 1983 por Gerard Salton Edward A Fox y Harry Wu El proposito del Modelo Booleano Extendido es superar las desventajas del Modelo Booleano que ha sido utilizado en recuperacion de informacion El Modelo Booleano no considera los pesos de los terminos en las consultas y el conjunto respuesta de una consulta booleana es con frecuencia demasiado pequeno o demasiado grande La idea del modelo extendido es hacer uso de la correspondencia parcial y los pesos de los terminos del Modelo de Espacio Vectorial combinandolos con las propiedades del Algebra Booleana De esta forma un documento puede ser un tanto relevante si contiene algunos terminos de la consulta y puede ser obtenido como respuesta mientras que en el Modelo Booleano esto no ocurre 1 Asi el Modelo Booleano Extendido puede ser considerado como una generalizacion de los modelos Booleano y Vectorial Ademas la investigacion ha demostrado mejoras en la efectividad respecto al procesamiento de consultas del Modelo Booleano Otras investigaciones han mostrado que la retroalimentacion y la expansion de consultas pueden ser adaptadas al procesamiento de consultas del Modelo Booleano Extendido Indice 1 Definiciones 2 Ejemplo en 2 Dimensiones 3 Generalizando la idea 4 Ejemplos 5 Mejoras respecto al Modelo Booleano 6 Vease tambien 7 Bibliografia 8 Enlaces externosDefiniciones EditarEn el Modelo Booleano Extendido un documento se representa por un vector al igual que en el Modelo Vectorial Cada componente corresponde a un termino asociado al documento El peso del termino K x displaystyle K x asociado al documento d j displaystyle d j se mide por su frecuencia de termino normalizada y puede definirse como w x j f x j I d f x m a x i I d f x displaystyle w x j f x j frac Idf x max i Idf x donde I d f x displaystyle Idf x es la frecuencia inversa de documento El vector de pesos asociado al documento d j displaystyle d j puede ser representado como v d j w 1 j w 2 j w i j displaystyle mathbf v d j w 1 j w 2 j ldots w i j Ejemplo en 2 Dimensiones Editar Fig 1 Similitud de la consulta q K x K y displaystyle q K x lor K y con los documentos d j displaystyle d j y d j 1 displaystyle d j 1 Fig 2 Similitud de la consulta q K x K y displaystyle q K x land K y con los documentos d j displaystyle d j y d j 1 displaystyle d j 1 Considerando el espacio compuesto por los dos terminos K x displaystyle K x y K y displaystyle K y los pesos correspondientes son w 1 displaystyle w 1 y w 2 displaystyle w 2 2 Asi para la consulta q o r K x K y displaystyle q or K x lor K y podemos calcular la similitud con la siguiente formula s i m q o r d w 1 2 w 2 2 2 displaystyle sim q or d sqrt frac w 1 2 w 2 2 2 Para la consulta q a n d K x K y displaystyle q and K x land K y podemos usar s i m q a n d d 1 1 w 1 2 1 w 2 2 2 displaystyle sim q and d 1 sqrt frac 1 w 1 2 1 w 2 2 2 Generalizando la idea EditarPodemos generalizar el ejemplo anterior en 2 dimensiones del Modelo Booleano Extendido al espacio t dimensional usando la distancia Euclidiana Esto puede hacerse usando Norma P que extiende la nocion de distancia para incluir p distancias donde 1 p displaystyle 1 leq p leq infty es un nuevo parametro 3 Una consulta conjuntiva general esta dada por q o r k 1 p k 2 p p k t displaystyle q or k 1 lor p k 2 lor p lor p k t La similitud de la consulta q o r displaystyle q or y el documento d j displaystyle d j puede definirse como s i m q o r d j w 1 p w 2 p w t p t p displaystyle sim q or d j sqrt p frac w 1 p w 2 p w t p t Una consulta disyuntiva general esta dada por q a n d k 1 p k 2 p p k t displaystyle q and k 1 land p k 2 land p land p k t La similitud de la consulta q a n d displaystyle q and y el documento d j displaystyle d j puede definirse como s i m q a n d d j 1 1 w 1 p 1 w 2 p 1 w t p t p displaystyle sim q and d j 1 sqrt p frac 1 w 1 p 1 w 2 p 1 w t p t Ejemplos EditarConsidere la consulta q K 1 K 2 K 3 displaystyle q K 1 land K 2 lor K 3 La similitud entre la consulta q displaystyle q y el documento d displaystyle d puede calcularse usando la formula s i m q d 1 1 w 1 p 1 w 2 p 2 p p w 3 p 2 p displaystyle sim q d sqrt p frac 1 sqrt p frac 1 w 1 p 1 w 2 p 2 p w 3 p 2 Mejoras respecto al Modelo Booleano EditarLee y Fox 4 compararon los modelos Booleano y Booleano Extendido con tres colecciones de prueba CISI CACM e INSPEC Utilizando Norma P se obtuvo un promedio de mejoras en la precision de 79 106 y 210 respecto al Modelo Booleano estandar para las colecciones CISI CACM e INSPEC respectivamente El modelo de Norma P es computacionalmente costoso por el numero de operaciones de exponenciacion que requiere sin embargo logra resultados mucho mejores que el Modelo Booleano e incluso que el Modelo Fuzzy El Modelo Booleano estandar es no obstante el mas eficiente Vease tambien EditarRecuperacion de informacionBibliografia Editar Salton Gerard Edward A Fox Harry Wu 1983 Extended Boolean information retrieval Communications of the ACM Volume 26 Issue 11 La referencia utiliza el parametro obsoleto coauthors ayuda Lusheng Wang Garcia Dr E The Extended Boolean Model Weighted Queries Term Weights p Norm Queries and Multiconcept Types Boolean OR Extended AND that is the Query archivado desde el original el 29 de mayo de 2010 Lee W C E A Fox 1988 Experimental Comparison of Schemes for Interpreting Boolean Queries La referencia utiliza el parametro obsoleto coauthors ayuda Enlaces externos EditarEsta obra contiene una traduccion derivada de Extended Boolean model de la Wikipedia en ingles publicada por sus editores bajo la Licencia de documentacion libre de GNU y la Licencia Creative Commons Atribucion CompartirIgual 3 0 Unported Datos Q796230Obtenido de https es wikipedia org w index php title Modelo Booleano Extendido amp oldid 117324061, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos