fbpx
Wikipedia

Procesamiento de lenguajes naturales

El procesamiento de lenguaje natural,[1][2]​ abreviado PLN[3][4]​ —en inglés, natural language processing, NLP— es un campo de las ciencias de la computación, de la inteligencia artificial y de la lingüística que estudia las interacciones entre las computadoras y el lenguaje humano. Se ocupa de la formulación e investigación de mecanismos eficaces computacionalmente para la comunicación entre personas y máquinas por medio del lenguaje natural, es decir, de las lenguas del mundo. No trata de la comunicación por medio de lenguas naturales de una forma abstracta, sino de diseñar mecanismos para comunicarse que sean eficaces computacionalmente —que se puedan realizar por medio de programas que ejecuten o simulen la comunicación—. Los modelos aplicados se enfocan no solo a la comprensión del lenguaje de por sí, sino a aspectos generales cognitivos humanos y a la organización de la memoria. El lenguaje natural sirve solo de medio para estudiar estos fenómenos. Hasta la década de 1980, la mayoría de los sistemas de PLN se basaban en un complejo conjunto de reglas diseñadas a mano. A partir de finales de 1980, sin embargo, hubo una revolución en PLN con la introducción de algoritmos de aprendizaje automático para el procesamiento del lenguaje.[5][6]

Historia

La historia del PLN empieza desde 1950, aunque se han encontrado trabajos anteriores. En 1950, Alan Turing publicó Computing machinery and intelligence, donde proponía lo que hoy se llama el test de turing como criterio de inteligencia. En 1954, el experimento de Georgetown involucró traducción automática de más de sesenta oraciones del ruso al inglés. Los autores sostuvieron que en tres o cinco años la traducción automática sería un problema resuelto. El avance real en traducción automática fue más lento, y en 1966 el reporte ALPAC demostró que la investigación había tenido un bajo desempeño. Más tarde, hasta finales de 1980, se llevaron a cabo investigaciones a menor escala en traducción automática, y se desarrollaron los primeros sistemas de traducción automática estadística. Esto se debió tanto al aumento constante del poder de cómputo resultante de la ley de Moore como a la disminución gradual del predominio de las teorías lingüísticas de Noam Chomsky (por ejemplo, la gramática transformacional), cuyos fundamentos teóricos desalentaron el tipo de lingüística de corpus, que se basa en el enfoque de aprendizaje de máquinas para el procesamiento del lenguaje. Se usaron entonces los primeros algoritmos de aprendizaje automático, como los árboles de decisión, sistemas producidos de sentencias si-entonces similares a las reglas escritas a mano. Se puede consultar un resumen de la historia de 50 años de publicaciones acerca del procesamiento automático después del proyecto NLP4NLP en una publicación doble en Frontiers in Research Metrics and Analytics.[7][8]

Dificultades en el procesamiento de lenguaje natural

Ambigüedad

Las lenguas naturales son inherentemente ambiguas en diferentes niveles:

  • En el nivel léxico, una misma palabra puede tener varios significados, y la selección del apropiado se debe deducir a partir del contexto oracional o conocimiento básico. Muchas investigaciones en el campo del procesamiento de lenguajes naturales han estudiado métodos de resolver las ambigüedades léxicas mediante diccionarios, gramáticas, bases de conocimiento y correlaciones estadísticas.
  • A nivel referencial, la resolución de anáforas y catáforas implica determinar la entidad lingüística previa o posterior a que hacen referencia.
  • En el nivel estructural, se requiere de la semántica para desambiguar la dependencia de los sintagmas preposicionales que conducen a la construcción de distintos árboles sintácticos. Por ejemplo, en la frase Rompió el dibujo de un ataque de nervios.
  • En el nivel pragmático, una oración, a menudo, no significa lo que realmente se está diciendo. Elementos tales como la ironía tienen un papel importante en la interpretación del mensaje.

Para resolver estos tipos de ambigüedades y otros, el problema central en el PLN es la traducción de entradas en lenguas naturales a una representación interna sin ambigüedad, como árboles de análisis.

Detección de separación entre las palabras

En la lengua hablada no se suelen hacer pausas entre palabra y palabra. El lugar en el que se deben separar las palabras a menudo depende de cuál es la posibilidad de que mantenga un sentido lógico tanto gramatical como contextual. En la lengua escrita, lenguas como el chino mandarín tampoco tienen separaciones entre las palabras.

Recepción imperfecta de datos

Acentos extranjeros, regionalismos o dificultades en la producción del habla, errores de mecanografiado o expresiones no gramaticales, errores en la lectura de textos mediante OCR

Componentes

  • Análisis morfológico. El análisis de las palabras para extraer raíces, rasgos flexivos, unidades léxicas compuestas y otros fenómenos.
  • Análisis sintáctico. El análisis de la estructura sintáctica de la frase mediante una gramática de la lengua en cuestión.
  • Análisis semántico. La extracción del significado de la frase, y la resolución de ambigüedades léxicas y estructurales.
  • Análisis pragmático. El análisis del texto más allá de los límites de la frase, por ejemplo, para determinar los antecedentes referenciales de los pronombres.
  • Planificación de la frase. Estructurar cada frase del texto con el fin de expresar el significado adecuado.
  • Generación de la frase. La generación de la cadena lineal de palabras a partir de la estructura general de la frase, con sus correspondientes flexiones, concordancias y restantes fenómenos sintácticos y morfológicos.

Procesamiento del lenguaje natural y Comprensión del lenguaje natural

 
Procesamiento del lenguaje natural y Comprensión del lenguaje natural

Es posible identificar dentro del PLN un subcampo especializado en las relaciones semánticas y pragmáticas, denominado Comprensión del lenguaje natural (CLN, en inglés Natural Language Understanding - NLU). La CLN agruparía, entonces, las áreas de resumen automático, paráfrasis, análisis de sentimientos y búsqueda de respuestas. De esta, la principal aplicación serían los chatbot o bot conversacionales. [9]

Aplicaciones

Las principales tareas de trabajo en el PLN son:

Véase también

Referencias

  1. Vásquez, Augusto Cortez; Huerta, Hugo Vega; Quispe, Jaime Pariona; Huayna, Ana Maria (2009). «Procesamiento de lenguaje natural». Revista de investigación de Sistemas e Informática 6 (2): 45-54. ISSN 1816-3823. Consultado el 7 de febrero de 2021. 
  2. Hernández, Myriam Beatriz; Gómez, José M. (31 de julio de 2013). «Aplicaciones de Procesamiento de Lenguaje Natural». Revista Politécnica 32. ISSN 2477-8990. Consultado el 7 de febrero de 2021. 
  3. «Inter-Active Terminology for Europe». 
  4. ««PLN», mejor que «NLP», sigla de «procesamiento del lenguaje natural»». www.fundeu.es. Consultado el 10 de julio de 2019. 
  5. Plan de impulso de Tecnologías del Lenguaje / Plan for the Advancement of Language Technology (en inglés). 2015. 
  6. Cervantes, Instituto (20 de octubre de 2015). Presentación del «Plan de Impulso de las Tecnologías del Lenguaje». OCLC 1164865977. Consultado el 21 de abril de 2021. 
  7. Mariani, Joseph; Francopoulo, Gil; Paroubek, Patrick (2019), «The NLP4NLP Corpus (I): 50 Years of Publication Collaboration and Citation in Speech and Language Processing», Frontiers in Research Metrics and Analytics .
  8. Mariani, Joseph; Francopoulo, Gil; Paroubek, Patrick; Vernier, Frédéric (2019), «The NLP4NLP Corpus (I): 50 Years of Research in Speech and Language Processing», Frontiers in Research Metrics and Analytics .
  9. Mattingly, William (27 de septiembre de 2021). «Natural Language Processing with spaCy & Python - Course for Beginners». 

Bibliografía

  • El procesamiento del lenguaje natural, tecnología en transición. Jaime Carbonell. Congreso de la Lengua Española, Sevilla, 1992
  • Lenguas y tecnologías de la información. Ángel G. Jordán. Congreso de la Lengua Española, Sevilla, 1992
  • Jurafsky, D. & JH. Martin (2018). Speech and Language Processing (3rd Edition). Pearson.

Enlaces externos

  • Procesamiento automático del español con enfoque en recursos léxicos grandes.
  • Investigaciones en análisis sintáctico para el español.
  • Computational Linguistics: Models, Resources, Applications. (con ejemplos en español)
  • Semantic Analysis of Verbal Collocations with Lexical Functions. (con ejemplos y diccionario en español)
  • Sobre la representación de la imprecisión del lenguaje natural mediante conjuntos difusos.
  • MachineReading: análisis de la estructura sintáctica de la frase
  • Extracción y Recuperación de Información. Según patrones: léxicos, sintácticos, semánticos y de discurso
  • Entrevista a Antonio Valderrábanos (Bitext) sobre buscadores y procesamiento del lenguaje natural
  •   Datos: Q30642
  •   Multimedia: Natural language processing / Q30642

procesamiento, lenguajes, naturales, procesamiento, lenguaje, natural, abreviado, inglés, natural, language, processing, campo, ciencias, computación, inteligencia, artificial, lingüística, estudia, interacciones, entre, computadoras, lenguaje, humano, ocupa, . El procesamiento de lenguaje natural 1 2 abreviado PLN 3 4 en ingles natural language processing NLP es un campo de las ciencias de la computacion de la inteligencia artificial y de la linguistica que estudia las interacciones entre las computadoras y el lenguaje humano Se ocupa de la formulacion e investigacion de mecanismos eficaces computacionalmente para la comunicacion entre personas y maquinas por medio del lenguaje natural es decir de las lenguas del mundo No trata de la comunicacion por medio de lenguas naturales de una forma abstracta sino de disenar mecanismos para comunicarse que sean eficaces computacionalmente que se puedan realizar por medio de programas que ejecuten o simulen la comunicacion Los modelos aplicados se enfocan no solo a la comprension del lenguaje de por si sino a aspectos generales cognitivos humanos y a la organizacion de la memoria El lenguaje natural sirve solo de medio para estudiar estos fenomenos Hasta la decada de 1980 la mayoria de los sistemas de PLN se basaban en un complejo conjunto de reglas disenadas a mano A partir de finales de 1980 sin embargo hubo una revolucion en PLN con la introduccion de algoritmos de aprendizaje automatico para el procesamiento del lenguaje 5 6 Indice 1 Historia 2 Dificultades en el procesamiento de lenguaje natural 2 1 Ambiguedad 2 2 Deteccion de separacion entre las palabras 2 3 Recepcion imperfecta de datos 3 Componentes 4 Procesamiento del lenguaje natural y Comprension del lenguaje natural 5 Aplicaciones 6 Vease tambien 7 Referencias 8 Bibliografia 9 Enlaces externosHistoria EditarLa historia del PLN empieza desde 1950 aunque se han encontrado trabajos anteriores En 1950 Alan Turing publico Computing machinery and intelligence donde proponia lo que hoy se llama el test de turing como criterio de inteligencia En 1954 el experimento de Georgetown involucro traduccion automatica de mas de sesenta oraciones del ruso al ingles Los autores sostuvieron que en tres o cinco anos la traduccion automatica seria un problema resuelto El avance real en traduccion automatica fue mas lento y en 1966 el reporte ALPAC demostro que la investigacion habia tenido un bajo desempeno Mas tarde hasta finales de 1980 se llevaron a cabo investigaciones a menor escala en traduccion automatica y se desarrollaron los primeros sistemas de traduccion automatica estadistica Esto se debio tanto al aumento constante del poder de computo resultante de la ley de Moore como a la disminucion gradual del predominio de las teorias linguisticas de Noam Chomsky por ejemplo la gramatica transformacional cuyos fundamentos teoricos desalentaron el tipo de linguistica de corpus que se basa en el enfoque de aprendizaje de maquinas para el procesamiento del lenguaje Se usaron entonces los primeros algoritmos de aprendizaje automatico como los arboles de decision sistemas producidos de sentencias si entonces similares a las reglas escritas a mano Se puede consultar un resumen de la historia de 50 anos de publicaciones acerca del procesamiento automatico despues del proyecto NLP4NLP en una publicacion doble en Frontiers in Research Metrics and Analytics 7 8 Dificultades en el procesamiento de lenguaje natural EditarAmbiguedad Editar Las lenguas naturales son inherentemente ambiguas en diferentes niveles En el nivel lexico una misma palabra puede tener varios significados y la seleccion del apropiado se debe deducir a partir del contexto oracional o conocimiento basico Muchas investigaciones en el campo del procesamiento de lenguajes naturales han estudiado metodos de resolver las ambiguedades lexicas mediante diccionarios gramaticas bases de conocimiento y correlaciones estadisticas A nivel referencial la resolucion de anaforas y cataforas implica determinar la entidad linguistica previa o posterior a que hacen referencia En el nivel estructural se requiere de la semantica para desambiguar la dependencia de los sintagmas preposicionales que conducen a la construccion de distintos arboles sintacticos Por ejemplo en la frase Rompio el dibujo de un ataque de nervios En el nivel pragmatico una oracion a menudo no significa lo que realmente se esta diciendo Elementos tales como la ironia tienen un papel importante en la interpretacion del mensaje Para resolver estos tipos de ambiguedades y otros el problema central en el PLN es la traduccion de entradas en lenguas naturales a una representacion interna sin ambiguedad como arboles de analisis Deteccion de separacion entre las palabras Editar En la lengua hablada no se suelen hacer pausas entre palabra y palabra El lugar en el que se deben separar las palabras a menudo depende de cual es la posibilidad de que mantenga un sentido logico tanto gramatical como contextual En la lengua escrita lenguas como el chino mandarin tampoco tienen separaciones entre las palabras Recepcion imperfecta de datos Editar Acentos extranjeros regionalismos o dificultades en la produccion del habla errores de mecanografiado o expresiones no gramaticales errores en la lectura de textos mediante OCRComponentes EditarAnalisis morfologico El analisis de las palabras para extraer raices rasgos flexivos unidades lexicas compuestas y otros fenomenos Analisis sintactico El analisis de la estructura sintactica de la frase mediante una gramatica de la lengua en cuestion Analisis semantico La extraccion del significado de la frase y la resolucion de ambiguedades lexicas y estructurales Analisis pragmatico El analisis del texto mas alla de los limites de la frase por ejemplo para determinar los antecedentes referenciales de los pronombres Planificacion de la frase Estructurar cada frase del texto con el fin de expresar el significado adecuado Generacion de la frase La generacion de la cadena lineal de palabras a partir de la estructura general de la frase con sus correspondientes flexiones concordancias y restantes fenomenos sintacticos y morfologicos Procesamiento del lenguaje natural y Comprension del lenguaje natural Editar Procesamiento del lenguaje natural y Comprension del lenguaje natural Es posible identificar dentro del PLN un subcampo especializado en las relaciones semanticas y pragmaticas denominado Comprension del lenguaje natural CLN en ingles Natural Language Understanding NLU La CLN agruparia entonces las areas de resumen automatico parafrasis analisis de sentimientos y busqueda de respuestas De esta la principal aplicacion serian los chatbot o bot conversacionales 9 Aplicaciones EditarLas principales tareas de trabajo en el PLN son Sintesis del discurso Analisis del lenguaje Comprension del lenguaje Reconocimiento del habla Sintesis de voz Generacion de lenguajes naturales Traduccion automatica Respuesta a preguntas Recuperacion de la informacion Extraccion de la informacionVease tambien EditarLenguaje natural Felisa Verdejo LLM modelo grande de lenguaje Referencias Editar Vasquez Augusto Cortez Huerta Hugo Vega Quispe Jaime Pariona Huayna Ana Maria 2009 Procesamiento de lenguaje natural Revista de investigacion de Sistemas e Informatica 6 2 45 54 ISSN 1816 3823 Consultado el 7 de febrero de 2021 Hernandez Myriam Beatriz Gomez Jose M 31 de julio de 2013 Aplicaciones de Procesamiento de Lenguaje Natural Revista Politecnica 32 ISSN 2477 8990 Consultado el 7 de febrero de 2021 Inter Active Terminology for Europe PLN mejor que NLP sigla de procesamiento del lenguaje natural www fundeu es Consultado el 10 de julio de 2019 Plan de impulso de Tecnologias del Lenguaje Plan for the Advancement of Language Technology en ingles 2015 Cervantes Instituto 20 de octubre de 2015 Presentacion del Plan de Impulso de las Tecnologias del Lenguaje OCLC 1164865977 Consultado el 21 de abril de 2021 Mariani Joseph Francopoulo Gil Paroubek Patrick 2019 The NLP4NLP Corpus I 50 Years of Publication Collaboration and Citation in Speech and Language Processing Frontiers in Research Metrics and Analytics Mariani Joseph Francopoulo Gil Paroubek Patrick Vernier Frederic 2019 The NLP4NLP Corpus I 50 Years of Research in Speech and Language Processing Frontiers in Research Metrics and Analytics Mattingly William 27 de septiembre de 2021 Natural Language Processing with spaCy amp Python Course for Beginners Bibliografia EditarEl procesamiento del lenguaje natural tecnologia en transicion Jaime Carbonell Congreso de la Lengua Espanola Sevilla 1992 Lenguas y tecnologias de la informacion Angel G Jordan Congreso de la Lengua Espanola Sevilla 1992 Jurafsky D amp JH Martin 2018 Speech and Language Processing 3rd Edition Pearson Enlaces externos EditarProcesamiento automatico del espanol con enfoque en recursos lexicos grandes Investigaciones en analisis sintactico para el espanol Computational Linguistics Models Resources Applications con ejemplos en espanol Semantic Analysis of Verbal Collocations with Lexical Functions con ejemplos y diccionario en espanol Sobre la representacion de la imprecision del lenguaje natural mediante conjuntos difusos Procesamiento del lenguaje natural para recuperacion de informacion Recuperacion y acceso a la informacion en la Web mediante herramientas de procesamiento del lenguaje natural MachineReading analisis de la estructura sintactica de la frase Extraccion y Recuperacion de Informacion Segun patrones lexicos sintacticos semanticos y de discurso Entrevista a Antonio Valderrabanos Bitext sobre buscadores y procesamiento del lenguaje natural Datos Q30642 Multimedia Natural language processing Q30642 Obtenido de https es wikipedia org w index php title Procesamiento de lenguajes naturales amp oldid 151026532, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos