fbpx
Wikipedia

Campo aleatorio condicional

Un campo aleatorio condicional (Conditional Random Field o CRF en inglés) es un modelo estocástico utilizado habitualmente para etiquetar y segmentar secuencias de datos o extraer información de documentos. En algunos contextos también se lo denomina campo aleatorio de Márkov (inglés: Markov random Fields, MRF).

Concepto Editar

Dada una secuencia de datos   este modelo asigna una etiqueta   para cada elemento  . Aunque presenta similitudes con los modelos ocultos de Márkov, estos son modelos generativos que modelan conjuntamente la distribución de probabilidad de las etiquetas (o estados) y las observaciones,  , mientras que los campos aleatorios condicionales modelan la probabilidad de la secuencia correcta de etiquetas condicionada por las observaciones,  , es decir, son modelos discriminativos.

Se puede representar con un grafo no dirigido   en el que cada vértice represente una variable aleatoria cuya distribución de probabilidad debe ser deducida, y cada arista indique una dependencia entre las variables de los vértices que conecta. El grafo obedece la propiedad de Márkov extendida a grafos:

 

donde   significa que los vértices   y   están conectados por una arista. En cuanto a los datos  , también llamados observaciones, lo más frecuente es que sean también una secuencia. Además, es frecuente que cada   sea un vector, no un valor escalar, en cuyo caso tendríamos observaciones multimensionales.

El grafo puede tener una estructura arbitrariamente compleja, aunque lo más común es que sea una cadena o un "rejilla". En una cadena, cada vértice está únicamente conectado con el vértice predecesor y con sus sucesor (se asume que los vértices están ordenados). En una rejilla, cada vértice está conectado con otros 4, excepto en los extremos; un vértice   estará conectado con   y  . En el caso de la cadena la propiedad de Márkov puede reescribirse de la siguiente forma:

 


Entrenamiento y uso Editar

Estos modelos necesitan ser entrenados con N muestras  ; cada una contiene un conjunto de observaciones así como las etiquetas asociadas a esas observaciones. El modelo extrae un conjunto de características   y   que representan las dependencias existentes entre diferentes estados y entre estos y la secuencia de observaciones. Al contrario que en los modelos ocultos de Márkov en donde cada estado   depende únicamente de la observación  , aquí cada estado puede depender de varias observaciones al mismo tiempo, incluso de la secuencia completa si fuese necesario. En el entrenamiento del modelo éste asigna unos pesos a cada una de esas características, indicando su relativa importancia según el caso. Puesto que el entrenamiento puede ser muy costoso en tiempo y en espacio, lo habitual es usar algoritmos de optimización numérica, como el denominado L-BFGS. En cuanto al uso, el algoritmo de Viterbi de los modelos ocultos de Márkov puede ser adaptado con facilidad. También se puede usar el algoritmo de propagación de creencias (belief propagation en inglés).

Herramientas Editar

Algunas implementaciones de este modelo son las siguientes:

 * MALLET, en Java * , en C++ * Implementación de K.Murphy, en Matlab * Implementación de S.Sarawagi, en Java 

Referencias Editar

  • Lafferty, J., McCallum, A., Pereira, F.: Conditional random fields: Probabilistic models for segmenting and labeling sequence data. In: Proc. 18th International Conf. on Machine Learning, Morgan Kaufmann, San Francisco, CA (2001) 282–289
  • McCallum, A.: Efficiently inducing features of conditional random fields. In: Proc. 19th Conference on Uncertainty in Artificial Intelligence. (2003)
  • Sha, F., Pereira, F.: Shallow parsing with conditional random fields. Technical Report MS-CIS-02-35, University of Pennsylvania (2003)
  • Wallach, H.M.: Conditional random fields: An introduction. Technical Report MS-CIS-04-21, University of Pennsylvania (2004)
  • Sutton, C., McCallum, A.: An Introduction to Conditional Random Fields for Relational Learning. In "Introduction to Statistical Relational Learning". Edited by Lise Getoor and Ben Taskar. MIT Press. (2006)
  • Wang, Y., Loe, K.F., Wu, J.K.: A dynamic conditional random field model for foreground and shadow segmentation. IEEE Trans Pattern Anal Mach Intell. 28(2):279-89 (2006)
  •   Datos: Q1124538

campo, aleatorio, condicional, campo, aleatorio, condicional, conditional, random, field, inglés, modelo, estocástico, utilizado, habitualmente, para, etiquetar, segmentar, secuencias, datos, extraer, información, documentos, algunos, contextos, también, denom. Un campo aleatorio condicional Conditional Random Field o CRF en ingles es un modelo estocastico utilizado habitualmente para etiquetar y segmentar secuencias de datos o extraer informacion de documentos En algunos contextos tambien se lo denomina campo aleatorio de Markov ingles Markov random Fields MRF Indice 1 Concepto 2 Entrenamiento y uso 3 Herramientas 4 ReferenciasConcepto EditarDada una secuencia de datos O 1 O N displaystyle O 1 O N nbsp este modelo asigna una etiqueta S i displaystyle S i nbsp para cada elemento O i displaystyle O i nbsp Aunque presenta similitudes con los modelos ocultos de Markov estos son modelos generativos que modelan conjuntamente la distribucion de probabilidad de las etiquetas o estados y las observaciones P S O displaystyle P S O nbsp mientras que los campos aleatorios condicionales modelan la probabilidad de la secuencia correcta de etiquetas condicionada por las observaciones P S O displaystyle P S O nbsp es decir son modelos discriminativos Se puede representar con un grafo no dirigido G V E displaystyle G V E nbsp en el que cada vertice represente una variable aleatoria cuya distribucion de probabilidad debe ser deducida y cada arista indique una dependencia entre las variables de los vertices que conecta El grafo obedece la propiedad de Markov extendida a grafos P S i O S j i j P S i O S j S i S j displaystyle P S i O S j i neq j P S i O S j S i sim S j nbsp donde displaystyle sim nbsp significa que los vertices S i displaystyle S i nbsp y S j displaystyle S j nbsp estan conectados por una arista En cuanto a los datos O i displaystyle O i nbsp tambien llamados observaciones lo mas frecuente es que sean tambien una secuencia Ademas es frecuente que cada O i displaystyle O i nbsp sea un vector no un valor escalar en cuyo caso tendriamos observaciones multimensionales El grafo puede tener una estructura arbitrariamente compleja aunque lo mas comun es que sea una cadena o un rejilla En una cadena cada vertice esta unicamente conectado con el vertice predecesor y con sus sucesor se asume que los vertices estan ordenados En una rejilla cada vertice esta conectado con otros 4 excepto en los extremos un vertice S i j displaystyle S ij nbsp estara conectado con S i j 1 S i j 1 S i 1 j displaystyle S i j 1 S i j 1 S i 1 j nbsp y S i 1 j displaystyle S i 1 j nbsp En el caso de la cadena la propiedad de Markov puede reescribirse de la siguiente forma P S i O S j i j P S i O S j S i 1 S i 1 displaystyle P S i O S j i neq j P S i O S j S i 1 S i 1 nbsp Entrenamiento y uso EditarEstos modelos necesitan ser entrenados con N muestras O i S i N 1 displaystyle O i S i N 1 nbsp cada una contiene un conjunto de observaciones asi como las etiquetas asociadas a esas observaciones El modelo extrae un conjunto de caracteristicas f i S i S i 1 displaystyle f i S i S i 1 nbsp y g i S i O displaystyle g i S i O nbsp que representan las dependencias existentes entre diferentes estados y entre estos y la secuencia de observaciones Al contrario que en los modelos ocultos de Markov en donde cada estado S i displaystyle S i nbsp depende unicamente de la observacion O i displaystyle O i nbsp aqui cada estado puede depender de varias observaciones al mismo tiempo incluso de la secuencia completa si fuese necesario En el entrenamiento del modelo este asigna unos pesos a cada una de esas caracteristicas indicando su relativa importancia segun el caso Puesto que el entrenamiento puede ser muy costoso en tiempo y en espacio lo habitual es usar algoritmos de optimizacion numerica como el denominado L BFGS En cuanto al uso el algoritmo de Viterbi de los modelos ocultos de Markov puede ser adaptado con facilidad Tambien se puede usar el algoritmo de propagacion de creencias belief propagation en ingles Herramientas EditarAlgunas implementaciones de este modelo son las siguientes MALLET en Java CRF en C Implementacion de K Murphy en Matlab Implementacion de S Sarawagi en JavaReferencias EditarLafferty J McCallum A Pereira F Conditional random fields Probabilistic models for segmenting and labeling sequence data In Proc 18th International Conf on Machine Learning Morgan Kaufmann San Francisco CA 2001 282 289 McCallum A Efficiently inducing features of conditional random fields In Proc 19th Conference on Uncertainty in Artificial Intelligence 2003 Sha F Pereira F Shallow parsing with conditional random fields Technical Report MS CIS 02 35 University of Pennsylvania 2003 Wallach H M Conditional random fields An introduction Technical Report MS CIS 04 21 University of Pennsylvania 2004 Sutton C McCallum A An Introduction to Conditional Random Fields for Relational Learning In Introduction to Statistical Relational Learning Edited by Lise Getoor and Ben Taskar MIT Press 2006 Wang Y Loe K F Wu J K A dynamic conditional random field model for foreground and shadow segmentation IEEE Trans Pattern Anal Mach Intell 28 2 279 89 2006 nbsp Datos Q1124538 Obtenido de https es wikipedia org w index php title Campo aleatorio condicional amp oldid 149008057, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos