fbpx
Wikipedia

BLEU

BLEU (Bilingual Evaluation Understudy) es un método de evaluación de la calidad de traducciones realizadas por sistemas de traducción automática. Una traducción tiene mayor calidad cuanto más similar es con respecto a otra de referencia, que se supone correcta. BLEU puede calcularse utilizando más de una traducción de referencia. Esto permite una mayor robustez a la medida frente a traducciones libres realizadas por humanos.

BLEU se calcula normalmente a nivel de frases y halla la precisión en ngramas entre la traducción del sistema y la de referencia. Sin embargo, se utiliza una precisión modificada con el fin de solucionar ciertas deficiencias en la medida.

Precisión modificada

La precisión de ngramas entre 2 frases es:

 
Ejemplo de precisión en 1-gramas
Candidata 1 A cat is on the mat
Candidata 2 The cat exists in the board
Referencia The cat is on the table

En este ejemplo la precisión en 1-gramas sería de   para la candidata 1 y de   para la 2.

La precisión no es una medida adecuada para calcular la similitud entre 2 frases, como se puede ver a continuación:

Ejemplo de mala traducción con una alta precisión
Candidata the the the the the the
Referencia The cat is on the table

En este caso tendríamos una precisión de  . Por ello se ha de tener en cuenta el número máximo de ocurrencias de un ngrama en la frase de referencia, siendo éste el límite a la hora de contabilizar las apariciones en la frase candidata. Con esto en cuenta la precisión modificada sería de   en este último ejemplo.

Penalización por brevedad

Si las frases a comparar tienen una longitud muy distinta, no podemos afirmar que sean similares. Si la frase candidata tiene mayor longitud que la de referencia, este aspecto se ve reflejado en la fórmula de precisión modificada anterior. Habrá muchos ngramas en la frase candidata que no aparecerán en la frase de referencia por lo que la precisión será menor. Esto no ocurre cuando la frase de referencia es mucho menor, tal y como se puede observar en el siguiente ejemplo:

Ejemplo de mala traducción con alta precisión
Candidata the the
Referencia The cat is on the table

La precisión modificada sería de   y no reflejaría la similitud entre ambas frases. Por ello se introduce un penalizador por brevedad de las frases candidatas.

 

donde c es la longitud de la frase candidata y r la longitud de la frase de referencia.

Cálculo de BLEU

Para el cálculo de BLEU se utiliza la media geométrica para los N ngramas que se vayan a utilizar. Cada ngrama tendrá un peso   tal que  . Típicamente  

 

Referencias

  • Papineni, K., Roukos, S., Ward, T., and Zhu, W. J. (2002). "BLEU: a method for automatic evaluation of machine translation" in ACL-2002: 40th Annual meeting of the Association for Computational Linguistics pp. 311--318

Véase también


  •   Datos: Q3500773

bleu, bilingual, evaluation, understudy, método, evaluación, calidad, traducciones, realizadas, sistemas, traducción, automática, traducción, tiene, mayor, calidad, cuanto, más, similar, respecto, otra, referencia, supone, correcta, puede, calcularse, utilizan. BLEU Bilingual Evaluation Understudy es un metodo de evaluacion de la calidad de traducciones realizadas por sistemas de traduccion automatica Una traduccion tiene mayor calidad cuanto mas similar es con respecto a otra de referencia que se supone correcta BLEU puede calcularse utilizando mas de una traduccion de referencia Esto permite una mayor robustez a la medida frente a traducciones libres realizadas por humanos BLEU se calcula normalmente a nivel de frases y halla la precision en ngramas entre la traduccion del sistema y la de referencia Sin embargo se utiliza una precision modificada con el fin de solucionar ciertas deficiencias en la medida Indice 1 Precision modificada 2 Penalizacion por brevedad 3 Calculo de BLEU 4 Referencias 5 Vease tambienPrecision modificada EditarLa precision de ngramas entre 2 frases es P ngramas comunes ngramas candidata displaystyle P frac mbox ngramas comunes mbox ngramas candidata Ejemplo de precision en 1 gramas Candidata 1 A cat is on the matCandidata 2 The cat exists in the boardReferencia The cat is on the tableEn este ejemplo la precision en 1 gramas seria de 4 6 displaystyle frac 4 6 para la candidata 1 y de 3 6 displaystyle frac 3 6 para la 2 La precision no es una medida adecuada para calcular la similitud entre 2 frases como se puede ver a continuacion Ejemplo de mala traduccion con una alta precision Candidata the the the the the theReferencia The cat is on the tableEn este caso tendriamos una precision de 6 6 1 displaystyle frac 6 6 1 Por ello se ha de tener en cuenta el numero maximo de ocurrencias de un ngrama en la frase de referencia siendo este el limite a la hora de contabilizar las apariciones en la frase candidata Con esto en cuenta la precision modificada seria de 2 6 displaystyle frac 2 6 en este ultimo ejemplo Penalizacion por brevedad EditarSi las frases a comparar tienen una longitud muy distinta no podemos afirmar que sean similares Si la frase candidata tiene mayor longitud que la de referencia este aspecto se ve reflejado en la formula de precision modificada anterior Habra muchos ngramas en la frase candidata que no apareceran en la frase de referencia por lo que la precision sera menor Esto no ocurre cuando la frase de referencia es mucho menor tal y como se puede observar en el siguiente ejemplo Ejemplo de mala traduccion con alta precision Candidata the theReferencia The cat is on the tableLa precision modificada seria de 2 2 1 displaystyle frac 2 2 1 y no reflejaria la similitud entre ambas frases Por ello se introduce un penalizador por brevedad de las frases candidatas P B 1 si c gt r e 1 r c displaystyle PB begin cases 1 mbox si c gt r e 1 frac r c end cases donde c es la longitud de la frase candidata y r la longitud de la frase de referencia Calculo de BLEU EditarPara el calculo de BLEU se utiliza la media geometrica para los N ngramas que se vayan a utilizar Cada ngrama tendra un peso w n displaystyle w n tal que n 1 N w n 1 displaystyle sum n 1 N w n 1 Tipicamente w n 1 N displaystyle w n frac 1 N B L E U P B exp n 1 N w n log P n displaystyle BLEU PB cdot exp left sum n 1 N w n log P n right Referencias EditarPapineni K Roukos S Ward T and Zhu W J 2002 BLEU a method for automatic evaluation of machine translation in ACL 2002 40th Annual meeting of the Association for Computational Linguistics pp 311 318Vease tambien EditarMetodos de evaluacion para la traduccion automatica Traduccion asistida Linguistica Traduccion automatica mediante lenguaje intermedio Traduccion automatica mediante transferencia Traduccion automatica basada en el contexto Traduccion automatica estadistica Datos Q3500773Obtenido de https es wikipedia org w index php title BLEU amp oldid 134625682, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos