fbpx
Wikipedia

Identificación de lenguaje en el límite

La identificación de lenguaje en el límite es un modelo formal para la inferencia inductiva. Fue presentado por E. Mark Gold en su artículo "Language identification in the limit".[1]​ En este modelo, a un aprendiz se le proporciona una presentación (es decir, cadenas de caracteres) de algún lenguaje formal. El aprendizaje se ve como un proceso infinito. Cada vez que se lee un elemento de la presentación, el aprendiz debe proporcionar una representación (por ejemplo, una gramática formal) para el lenguaje. Se dice que un aprendiz puede identificar en el límite una clase de lenguajes si, dada cualquier presentación de cualquier lenguaje en la clase, el aprendiz producirá solo un número finito de representaciones erróneas y, por lo tanto, convergerá a la representación correcta en un número finito de pasos, sin embargo, sin poder necesariamente anunciar su correctitud ya que, posteriormente, un contraejemplo de esa representación podría aparecer como un elemento.

Gold definió dos tipos de presentaciones:

  • Presentación por texto (información positiva): una enumeración de todas las cadenas de caracteres en que consiste el lenguaje. 
  • Presentación completa (información positiva y negativa): una enumeración de todas las cadenas de caracteres posibles, cada una con una etiqueta que indica si la cadena pertenece al lenguaje o no.

Capacidad de aprendizaje Editar

Este modelo es un intento temprano por capturar formalmente la noción de capacidad de aprendizaje. En su artículo,[2]​ Gold introduce para contrastar los modelos más fuertes:

  • Identificación finita (dónde el aprendiz tiene que anunciar la correctitud después de un número finito de pasos), y
  • Identificación en tiempo fijo (dónde la correctitud tiene que alcanzarse en un número de pasos fijado a priori).

Un modelo formal más débil es el Aprendizaje PAC, introducido por Leslie Valiant en 1984.

Ejemplos Editar

Presentación completa por petición
Profesor Aprendiz
Suposición
0. abab
1. yes abab baba
2. yes a(ba)*b* aa
3. no (ab)(ba)(ab)(ba)* bababa
4. yes (ab+ba)* babb
5. no (ab+ba)* baaa
... .
Presentación completa por revelación
Profesor Aprendiz
1. abab abab
2. baba a(ba)*b*
3. aa (ab)(ba)(ab)(ba)*
4. bababa (ab+ba)*
5. babb (ab+ba)*
6. baaa (ab+ba)*
7. ε (ab+ba)*
... ...
Unión-suposición
Profesor Aprendiz
1. abab abab
2. ba abab+ba
3. baba abab+ba+baba
4. ba abab+ba+baba
5. baba abab+ba+baba
6. abab abab+ba+baba
7. ε abab+ba+baba+ε
... ...
Presentación por texto
Profesor Aprendiz
1. abab abab
2. baba abab+baba
3. baabab (b+ε)(ab)*
4. baabab (b+ε)(ab)+baabab
5. abbaabba (ab)(ba)(ab)(ba)*
6. baabbaab (ab+ba)*
7. bababa (ab+ba)*
... ...
  1. Una sesión ficticia para aprender un lenguaje regular L sobre el alfabeto {a, b} a partir de presentación por texto. En cada paso, el profesor da una cadena que pertenece a L, y el aprendiz responde una suposición para L, en forma de expresión regular. En el paso 3, la suposición del aprendiz no es consistente con las cadenas vistas hasta el momento; en el paso 4, el maestro da una cadena repetidamente. Después del paso 6, el aprendiz se mantiene dando como expresión regular (ab+ba)*. Si esto resulta ser una descripción del lenguaje L que el maestro tiene en mente, se dice que el aprendiz ha aprendido ese lenguaje. Si existiera un programa de computadora para el rol del aprendiz que pudiera aprender con éxito cada lenguaje regular, esa clase de lenguajes sería identificable en el límite. Gold ha demostrado que este no es el caso.[3]
  2. Un algoritmo de aprendizaje particular que siempre supone que L es la unión de todas las cadenas de caracteres vistas hasta el momento. Si L es un lenguaje finito, el aprendiz eventualmente lo adivinará correctamente, sin embargo, sin poder decir cuándo. Aunque la suposición no cambió durante los pasos del 3 al 6, el aprendiz no podría estar seguro de estar en lo correcto. Gold ha demostrado que la clase de lenguajes finitos es identificable en el límite;[4]​ sin embargo, esta clase no es ni finita ni identificable en tiempo fijo.
  3. Aprendizaje a través de presentación completa por revelación. En cada paso, el profesor da una cadena de caracteres y dice si pertenece a L o no. Cada cadena posible es finalmente clasificada de este modo por el profesor.
  4. Aprendizaje a través de presentación completa por petición. El aprendiz da una cadena de consulta, el maestro dice si pertenece a L o no; el alumno entonces da una suposición para L, seguido de la siguiente cadena de consulta. En este ejemplo, el alumno consulta en cada paso la misma cadena que da el profesor en el ejemplo 3. En general, Gold ha demostrado que cada clase de lenguaje identificable en la configuración de presentación por petición también es identificable en el límite en la configuración de presentación por revelación,[5]​ ya que el alumno, en lugar de consultar una cadena, sólo tiene que esperar hasta que sea eventualmente el profesor se la proporcione.

Caracterización de capacidad de aprendizaje Editar

Dana Angluin dio las caracterizaciones de aprendizaje a través de presentación por texto (información positiva) en un artículo[6]​ de 1980. Si se requiere que un alumno sea eficaz, entonces se puede aprender una clase indizada de lenguajes recursivos en el límite si hay un procedimiento efectivo que enumere uniformemente las cadenas que caracteres que ocurren solo en un lenguaje para cada lenguaje de la clase (condición 1).[7]​ No es difícil ver que si permitimos a un aprendiz ideal (es decir, una función arbitraria), entonces una clase indexada de lenguajes es aprendible en el límite si cada lenguaje en la clase tiene una cadena que caracteres que solo ocurre en ese lenguaje (condición 2).[8]

Clases de lenguajes aprendibles en el límite Editar

Líneas divisoras entre clases de lenguajes aprendibles y no aprendibles[9]
Modelos de aprendizajes Clases de lenguajes
Presentación por texto análogo[note 1]
Recursivamente enumerable
Recursivo
Presentación completa
Primitivo recursivo[note 2]
Sensible al contexto
Libre de contexto
Regular
Super finito[note 3]
Presentación por texto normal[note 4]
Finito
Singleton[note 5]

La tabla muestra qué clases de lenguajes son identificables en el límite en qué modelo de aprendizaje. En el lado derecho, cada clase de lenguaje es un superclase de todas las clases más bajas. Cada modelo de aprendizaje (i.e. tipo de presentación) puede identificar en el límite todas las clases de abajo. En particular, la clase de lenguajes finitos es identificable en el límite por presentación por texto (cf. Ejemplo 2 encima), mientras que la clase de los lengujes regulares no lo es.

Condiciones suficientes para capacidad de aprendizaje Editar

La condición 1 en el artículo de Angluin[7]​ no siempre es fácil de verificar. Por lo tanto, han surgido varias condiciones suficientes para la aprendibilidad de una clase de lenguaje.

Espesor finito Editar

Una clase de lenguajes tiene espesor finito si cada conjunto no vacío de cadenas de caracteres está contenido en, a lo sumo, un número finito de lenguajes de la clase. Esta es exactamente la Condición 3 en artículo de Angluin.[10][11]​ Angluin mostró que si una clase de lenguajes recursivos tiene espesor finito, entonces es aprendible en el límite.[12]

Una clase con espesor finito sin duda satisface la MEF-condición y  la MFP-condición; en otras palabras, espesor finito implica M-espesor finito.[13]

Elasticidad finita Editar

Una clase de lenguajes se dice que tiene elasticidad finita si para cada secuencia infinita de cadenas   y cada secuencia infinita de lenguajes en la clase  , existe un número finito n tal que   implica que   es inconsistente con  .[14]

Está demostrado que una clase de lenguajes recursivamente enumerable se puede aprender en el límite si tiene elasticidad finita.

Límite de cambio de idea Editar

Un límite sobre el número de cambios de hipótesis que se producen antes de la convergencia.

Otros conceptos Editar

Propiedad de cruzamiento infinito Editar

Un lenguaje L tiene propiedad de cruzamiento finito dentro de una clase de lenguajes   si hay una secuencia infinita   lenguajes distintos en   y una secuencia de subconjunto finito   tal que:

  •  ,
  •  ,
  • Error al representar (SVG (MathML puede ser habilitado mediante un plugin de navegador): respuesta no válida («Math extension cannot connect to Restbase.») del servidor «http://localhost:6011/es.wikipedia.org/v1/»:): {\displaystyle T_{i+1}\not\in L_i} , and
  •  .

Tenga en cuenta que L no es necesariamente un miembro de la clase de lenguaje.

No es difícil ver que si hay un lenguaje que cumple propiedad de cruzamiento infinito dentro de una clase de lenguajes, entonces esa clase de lenguajes tiene elasticidad infinita.

Relaciones entre los conceptos Editar

  • Espesor finito implica elasticidad finita;[13][15]​ el recíproco no es cierto.
  • Elasticidad finita y aprendizaje de manera conservadora implica la existencia de un límite de cambio de idea.
  • Elasticidad finita y espesor M-finito implica la existencia de un límite de cambio de idea. Sin embargo, espesura M-finita solamente no implica la existencia de un límite de cambio de idea; tampoco la existencia de un límite de cambio de idea implica espesura M-finita.
  • La existencia de límite de cambio de idea implica capacidad de aprendizaje; el recíproco no es cierto.
  • Si permitimos aprendices no computables, entonces elasticidad finita implica la existencia de un límite de cambio de idea; el recíproco no es cierto.
  • Si no hay orden de acumulación para una clase de lenguajes, entonces hay un lenguaje (no necesariamente en la clase) que tiene propiedad de cruzamiento infinito dentro de la clase, que a su vez implica elasticidad infinita de la clase.

Preguntas abiertas Editar

  • Si una clase contable de los lenguajes recursivos tiene un límite de cambio de idea para aprendices no computables, ¿la clase también tiene un límite de cambio de idea para aprendices computables, o la clase no puede ser aprendida por un aprendiz computable?

Notas Editar

  1. i.e. presentación por texto, donde la cadena de caracteres dada por el profesor es una función primitiva recursiva del número de paso actual, y el aprendiz codifica una suposición de lenguaje como un programa que enumera el lenguaje
  2. i.e. la clase de lenguajes que son decidibles por una función primitiva recursiva
  3. i.e. contiene todos los lenguajes finitos y al menos un lenguaje infinito
  4. i.e. presentación por texto, excepto para la configuración presentación por texto anómalo
  5. i.e. la clase de lenguajes consistente en solo una cadena de caracteres

Referencias Editar

  1. Gold, E. Mark (1967). «Language identification in the limit». Information and Control 10 (5): 447-474. doi:10.1016/S0019-9958(67)91165-5. 
  2. p.457
  3. Theorem I.8,I.9, p.470-471
  4. Theorem I.6, p.469
  5. Theorem I.3, p.467
  6. Dana Angluin (1980). «Inductive Inference of Formal Languages from Positive Data». Information and Control 45: 117-135. doi:10.1016/S0019-9958(80)90285-5. 
  7. p.121 top
  8. p.123 top
  9. Table 1, p.452, in (Gold 1967)
  10. Dana Angluin (1980). «Finding Patterns Common to a Set of Strings». Journal of Computer and System Sciences 21: 46-62. doi:10.1016/0022-0000(80)90041-0. 
  11. p.123 mid
  12. p.123 bot, Corollary 2
  13. Andris Ambainis; Sanjay Jain; Arun Sharma (1997). «Ordinal mind change complexity of language identification». Computational Learning Theory. LNCS 1208. Springer. pp. 301-315. ; here: Proof of Corollary 29
  14. Motoki, Shinohara, and Wright (1991) "The correct definition of finite elasiticity: corrigendum to identification of unions", Proc. 4th Workshop on Computational Learning Theory, 375-375
  15. Wright, Keith (1989) "Identification of Unions of Languages Drawn from an Identifiable Class". Proc. 2nd Workwhop on Computational Learning Theory, 328-333; with correction in:[14]
  •   Datos: Q16248789

identificación, lenguaje, límite, laidentificación, lenguaje, límitees, modelo, formal, para, lainferencia, inductiva, presentado, mark, gold, artículo, language, identification, limit, este, modelo, aprendiz, proporciona, presentación, decir, cadenas, caracte. Laidentificacion de lenguaje en el limitees un modelo formal para lainferencia inductiva Fue presentado por E Mark Gold en su articulo Language identification in the limit 1 En este modelo a un aprendiz se le proporciona una presentacion es decir cadenas de caracteres de algun lenguaje formal El aprendizaje se ve como un proceso infinito Cada vez que se lee un elemento de la presentacion el aprendiz debe proporcionar una representacion por ejemplo una gramatica formal para el lenguaje Se dice que un aprendiz puede identificar en el limite una clase de lenguajes si dada cualquier presentacion de cualquier lenguaje en la clase el aprendiz producira solo un numero finito de representaciones erroneas y por lo tanto convergera a la representacion correcta en un numero finito de pasos sin embargo sin poder necesariamente anunciar su correctitud ya que posteriormente un contraejemplo de esa representacion podria aparecer como un elemento Gold definio dos tipos de presentaciones Presentacion por texto informacion positiva una enumeracion de todas las cadenas de caracteres en que consiste el lenguaje Presentacion completa informacion positiva y negativa una enumeracion de todas las cadenas de caracteres posibles cada una con una etiqueta que indica si la cadena pertenece al lenguaje o no Indice 1 Capacidad de aprendizaje 2 Ejemplos 3 Caracterizacion de capacidad de aprendizaje 4 Clases de lenguajes aprendibles en el limite 5 Condiciones suficientes para capacidad de aprendizaje 5 1 Espesor finito 5 2 Elasticidad finita 6 Limite de cambio de idea 7 Otros conceptos 7 1 Propiedad de cruzamiento infinito 8 R elaciones entre los conceptos 9 Preguntas abiertas 10 Notas 11 ReferenciasCapacidad de aprendizaje EditarEste modelo es un intento temprano por capturar formalmente la nocion de capacidad de aprendizaje En su articulo 2 Gold introduce para contrastar los modelos mas fuertes Identificacion finita donde el aprendiz tiene que anunciar la correctitud despues de un numero finito de pasos y Identificacion en tiempo fijo donde la correctitud tiene que alcanzarse en un numero de pasos fijado a priori Un modelo formal mas debil es el Aprendizaje PAC introducido por Leslie Valiant en 1984 Ejemplos EditarPresentacion completa por peticion Profesor AprendizSuposicion0 abab1 yes abab baba2 yes a ba b aa3 no ab ba ab ba bababa4 yes ab ba babb5 no ab ba baaa Presentacion completa por revelacion Profesor Aprendiz1 abab abab2 baba a ba b 3 aa ab ba ab ba 4 bababa ab ba 5 babb ab ba 6 baaa ab ba 7 e ab ba Union suposicion Profesor Aprendiz1 abab abab2 ba abab ba3 baba abab ba baba4 ba abab ba baba5 baba abab ba baba6 abab abab ba baba7 e abab ba baba e Presentacion por texto Profesor Aprendiz1 abab abab2 baba abab baba3 baabab b e ab 4 baabab b e ab baabab5 abbaabba ab ba ab ba 6 baabbaab ab ba 7 bababa ab ba Una sesion ficticia para aprender un lenguaje regular L sobre el alfabeto a b a partir de presentacion por texto En cada paso el profesor da una cadena que pertenece a L y el aprendiz responde una suposicion para L en forma de expresion regular En el paso 3 la suposicion del aprendiz no es consistente con las cadenas vistas hasta el momento en el paso 4 el maestro da una cadena repetidamente Despues del paso 6 el aprendiz se mantiene dando como expresion regular ab ba Si esto resulta ser una descripcion del lenguaje L que el maestro tiene en mente se dice que el aprendiz ha aprendido ese lenguaje Si existiera un programa de computadora para el rol del aprendiz que pudiera aprender con exito cada lenguaje regular esa clase de lenguajes seria identificable en el limite Gold ha demostrado que este no es el caso 3 Un algoritmo de aprendizaje particular que siempre supone que L es la union de todas las cadenas de caracteres vistas hasta el momento Si L es un lenguaje finito el aprendiz eventualmente lo adivinara correctamente sin embargo sin poder decir cuando Aunque la suposicion no cambio durante los pasos del 3al 6 el aprendiz no podria estar seguro de estar en lo correcto Gold ha demostrado que la clase de lenguajes finitos esidentificable en el limite 4 sin embargo esta clase no es ni finita ni identificable en tiempo fijo Aprendizaje a traves de presentacion completa por revelacion En cada paso el profesor da una cadena de caracteres y dice si pertenece a L o no Cada cadena posible es finalmente clasificada de este modo por el profesor Aprendizaje a traves de presentacion completa por peticion El aprendiz da una cadena de consulta el maestro dice si pertenece a L o no el alumno entonces da una suposicion para L seguido de la siguiente cadena de consulta En este ejemplo el alumno consulta en cada paso la misma cadena que da el profesor en el ejemplo 3 En general Gold ha demostrado que cada clase de lenguaje identificable en la configuracion de presentacion por peticion tambien es identificable en el limite en la configuracion de presentacion por revelacion 5 ya que el alumno en lugar de consultar una cadena solo tiene que esperar hasta que sea eventualmente el profesor se la proporcione Caracterizacion de capacidad de aprendizaje EditarDana Angluin dio las caracterizaciones de aprendizaje a traves de presentacion por texto informacion positiva en un articulo 6 de 1980 Si se requiere que un alumno sea eficaz entonces se puede aprender una clase indizada de lenguajes recursivos en el limite si hay un procedimiento efectivo que enumere uniformemente las cadenas que caracteres que ocurren solo en un lenguaje para cada lenguaje de la clase condicion 1 7 No es dificil ver que si permitimos a un aprendiz ideal es decir una funcion arbitraria entonces una clase indexada de lenguajes es aprendible en el limite si cada lenguaje en la clase tiene una cadena que caracteres que solo ocurre en ese lenguaje condicion 2 8 Clases de lenguajes aprendibles en el limite EditarLineas divisoras entre clases de lenguajes aprendibles y no aprendibles 9 Modelos de aprendizajes Clases de lenguajesPresentacion por texto analogo note 1 Recursivamente enumerableRecursivoPresentacion completaPrimitivo recursivo note 2 Sensible al contextoLibre de contextoRegularSuper finito note 3 Presentacion por texto normal note 4 FinitoSingleton note 5 La tabla muestra que clases de lenguajes son identificables en el limite en que modelo de aprendizaje En el lado derecho cada clase de lenguaje es un superclase de todas las clases mas bajas Cada modelo de aprendizaje i e tipo de presentacion puede identificar en el limite todas las clases de abajo En particular la clase de lenguajes finitos es identificable en el limite por presentacion por texto cf Ejemplo 2 encima mientras que la clase de los lengujes regulares no lo es Condiciones suficientes para capacidad de aprendizaje EditarLa condicion 1 en el articulo de Angluin 7 no siempre es facil de verificar Por lo tanto han surgido varias condiciones suficientes para la aprendibilidad de una clase de lenguaje Espesor finito Editar Una clase de lenguajes tiene espesor finito si cada conjunto no vacio de cadenas de caracteres esta contenido en a lo sumo un numero finito de lenguajes de la clase Esta es exactamente la Condicion 3 en articulo de Angluin 10 11 Angluin mostro que si una clase de lenguajes recursivos tiene espesor finito entonces es aprendible en el limite 12 Una clase con espesor finito sin duda satisface la MEF condicion y la MFP condicion en otras palabras espesor finito implica M espesor finito 13 Elasticidad finita Editar Una clase de lenguajes se dice que tiene elasticidad finita si para cada secuencia infinita de cadenas s 0 s 1 displaystyle s 0 s 1 nbsp y cada secuencia infinita de lenguajes en la clase L 1 L 2 displaystyle L 1 L 2 nbsp existe un numero finito n tal que s n L n displaystyle s n not in L n nbsp implica que L n displaystyle L n nbsp es inconsistente con s 1 s n 1 displaystyle s 1 s n 1 nbsp 14 Esta demostrado que una clase de lenguajes recursivamente enumerable se puede aprender en el limite si tiene elasticidad finita Limite de cambio de idea EditarUn limite sobre el numero de cambios de hipotesis que se producen antes de la convergencia Otros conceptos EditarPropiedad de cruzamiento infinito Editar Un lenguaje L tiene propiedad de cruzamiento finitodentro de una clase de lenguajes L displaystyle mathcal L nbsp si hay una secuencia infinita L i displaystyle L i nbsp lenguajes distintos en L displaystyle mathcal L nbsp y una secuencia de subconjunto finito T i displaystyle T i nbsp tal que T 1 T 2 displaystyle T 1 subset T 2 subset nbsp T i L i displaystyle T i in L i nbsp Error al representar SVG MathML puede ser habilitado mediante un plugin de navegador respuesta no valida Math extension cannot connect to Restbase del servidor http localhost 6011 es wikipedia org v1 displaystyle T i 1 not in L i and lim n T i L displaystyle lim n infty T i L nbsp Tenga en cuenta que L no es necesariamente un miembro de la clase de lenguaje No es dificil ver que si hay un lenguaje que cumple propiedad de cruzamiento infinito dentro de una clase de lenguajes entonces esa clase de lenguajes tiene elasticidad infinita R elaciones entre los conceptos EditarEspesor finito implica elasticidad finita 13 15 el reciproco no es cierto Elasticidad finitay aprendizaje de manera conservadora implica la existencia de un limite de cambio de idea Elasticidad finita y espesor M finitoimplica la existencia de un limite de cambio de idea Sin embargo espesura M finita solamente no implica la existencia de un limite de cambio de idea tampoco la existencia de un limite de cambio de idea implica espesura M finita La existencia de limite de cambio de ideaimplica capacidad de aprendizaje el reciproco no es cierto Si permitimos aprendices no computables entonces elasticidad finita implica la existencia de un limite de cambio de idea el reciproco no es cierto Si no hay orden de acumulacion para una clase de lenguajes entonces hay un lenguaje no necesariamente en la clase que tiene propiedad de cruzamiento infinitodentro de la clase que a su vez implica elasticidad infinitade la clase Preguntas abiertas EditarSi una clase contable de los lenguajes recursivos tiene un limite de cambio de idea para aprendices no computables la clase tambien tiene un limite de cambio de idea para aprendices computables o la clase no puede ser aprendida por un aprendiz computable Notas Editar i e presentacion por texto donde la cadena de caracteres dada por el profesor es una funcion primitiva recursiva del numero de paso actual y el aprendiz codifica una suposicion de lenguaje como un programa que enumera el lenguaje i e la clase de lenguajes que son decidibles por una funcion primitiva recursiva i e contiene todos los lenguajes finitos y al menos un lenguaje infinito i e presentacion por texto excepto para la configuracion presentacion por texto anomalo i e la clase de lenguajes consistente en solo una cadena de caracteresReferencias Editar Gold E Mark 1967 Language identification in the limit Information and Control 10 5 447 474 doi 10 1016 S0019 9958 67 91165 5 p 457 Theorem I 8 I 9 p 470 471 Theorem I 6 p 469 Theorem I 3 p 467 Dana Angluin 1980 Inductive Inference of Formal Languages from Positive Data Information and Control 45 117 135 doi 10 1016 S0019 9958 80 90285 5 a b p 121 top p 123 top Table 1 p 452 in Gold 1967 Dana Angluin 1980 Finding Patterns Common to a Set of Strings Journal of Computer and System Sciences 21 46 62 doi 10 1016 0022 0000 80 90041 0 p 123 mid p 123 bot Corollary 2 a b Andris Ambainis Sanjay Jain Arun Sharma 1997 Ordinal mind change complexity of language identification Computational Learning Theory LNCS 1208 Springer pp 301 315 here Proof of Corollary 29 a b Motoki Shinohara and Wright 1991 The correct definition of finite elasiticity corrigendum to identification of unions Proc 4th Workshop on Computational Learning Theory 375 375 Wright Keith 1989 Identification of Unions of Languages Drawn from an Identifiable Class Proc 2nd Workwhop on Computational Learning Theory 328 333 with correction in 14 nbsp Datos Q16248789 Obtenido de https es wikipedia org w index php title Identificacion de lenguaje en el limite amp oldid 151282034, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos