fbpx
Wikipedia

Keith van Rijsbergen

Cornelius Joost van Rijsbergen (Róterdam, 1943), más conocido como Keith van Rijsbergen, es un informático teórico, informatólogo e investigador del procesamiento del lenguaje natural y de la disciplina Recuperación de información.

Keith van Rijsbergen
Información personal
Nacimiento 1943
Países Bajos Países Bajos, Róterdam
Nacionalidad holandesa
Lengua materna Inglés
Educación
Educado en
Supervisor doctoral John Kenneth Montague Moody
Información profesional
Ocupación informático teórico, informatólogo
Conocido por Técnica de clusters, Modelo probabilístico de Recuperación de información. Procesamiento del lenguaje natural
Miembro de Association for Computing Machinery
Distinciones Premio Tony Kent (2004), Premio Gerard Salton (2006)

Biografía

Nace en Róterdam (Holanda) y durante su niñez y juventud vivió en distintos países como Holanda, Indonesia, Namibia y, finalmente, Australia. Realiza estudios universitarios en Western (Australia), donde empieza a interesarse por las matemáticas. En 1972 es investido como doctor por la Universidad de Cambridge con una tesis sobre programación informática.

Hasta 1975 permanece en la Universidad de Monash estudiando la inteconexión entre la Inteligencia artificial y la Recuperación de información. Vuelve al Laboratorio de Informática de Cambridge como miembro honorario (fellowship) de la Royal Society Information Research. En 1980 ocupa la cátedra de informática de la Universidad de Dublín y en 1986 se integra a la Universidad de Glasgow para dirigir el grupo de investigación en Recuperación de información.

En 1993 fue designado como redactor-jefe de la revista científica The Computer Journal hasta 2000.

Obra científica. Las técnicas de cluster

Desde 1969, Rijsbergen lleva investigando la base teórica de los sistemas de recuperación de información, dotándola de sólidos principios. Definió la diferencia entre Recuperación de datos y Recuperación de información distinguiendo la primera como un proceso de obtención de datos exactos y concretos, y la segunda como un proceso basado en una inferencia inductiva; es decir, buscar fechas o nombres es recuperación de datos, mientras que buscar temas sería recuperación de información.

Durante la década de los 70 y principio de los 80, ideó las técnicas de cluster, también llamadas clustering, o clasificación automática. Son técnicas estadísticas multivariantes que se utilizan para hacer agrupaciones de objetos similares en un espacio multidimensional. Las similitudes pueden ser calculadas entre pares de documentos, basándose en el número de descriptores que tienen en común. La aplicación en una base de datos documental dará como resultado el agrupamiento de documentos que tengan un gran número de términos en común.

Estás técnicas también son aplicadas a descriptores, cuyas similitudes nos permiten identificar relaciones semánticas entre términos. Este método resulta muy útil para construir tesauros.

Las técnicas de cluster se apoyan en los algoritmos de indización ponderada que ya diseñó Karen Spärck Jones. Esta indización automatizada considera mediante conclusiones estadísticas, qué términos representan mejor los contenidos de un documento. Esto daría fin al dilema conocido como conflicto de Rijsbergen: cuanto más términos del documento estén disponibles para la equiparación, más fácil el documentos será equipado en una búsqueda, pero más difícil distinguirlo de otros documentos.

Rijsbergen planteó además dos hipótesis:

  • Hipótesis de cluster: donde definía qué documentos similares tienden a ser relevantes para las mismas preguntas, y por tanto, ser útil para agrupar documentos relevantes para un petición concreta. Esta aplicación permitiría realizar búsquedas de alta precisión en una base de datos documental previamente clasificada.
  • Hipótesis de asociación: donde dice que un término de indización es bueno para discriminar documentos relevantes de aquellos que no lo son, cualquier término de indización estrechamente relacionado con ese es, probablemente, tan bueno como ese.

El uso de estas técnias fue empleado dentro del modelo probabilístico de recuperación de información, en redes de inferencia bayesiana y en técnicas de retroalimentación por relevancia.

A mediados de los 80, comenzó a abordar la investigación a través de los modelos cognitivos de recuperación de información. Esto modelos otorgan al usuario una importancia mayor al tener en cuenta tanto la formación del usuario como a la naturaleza y propiedades de sus búsquedas. Rijsbergen utilizó el principio de incertidumbre lógica al considerar que una colección documental no es, en su conjunto, ni completa y coherente para los usuarios, llegando incluso a haber elementos contradictorios entre sí. Propuso un paradigma nuevo donde el proceso de recuperación sea considerado como un proceso de inferencia incierta, y las consultas y los documentos puedan ser representados como declaraciones lógica-probabilísticas.

Obras y reconocimientos

En 1975 publicó Information retrieval, obra con abundante material original sobre el modelo probabilístico, además de aportar reformulaciones originales de trabajos de otros autores. Es considerado como un texto clásico de la materia. Ha sido editado también en CD.

En 1999 publicaría en coautoría con Crestani y Lalmas Recuperación de información: la incertidumbre y la lógica, donde trataría sus aportaciones en lógica inferencial. También ha publicado numerosos artículos en prestigiosas revistas científicas.

Ha sido premiado con el Premio Tony Kent en 2004 y el Premio Gerard Salton 2006.

Es miembro del Institut of Electrical Engineers (IEE), de la British Computer Society (BCS) y de la Association of Computing Machinery (ACM)(SIGIR).

Obras de referencia

  • MOYA ANEGÓN; Félix de (2002): Técnicas avanzadas de recuperación documental. En: Manual de Ciencias de la Documentación. Madrid : Pirámide.

Enlaces externos

  • Premios Gerard Salton
  •   Datos: Q92667

keith, rijsbergen, cornelius, joost, rijsbergen, róterdam, 1943, más, conocido, como, informático, teórico, informatólogo, investigador, procesamiento, lenguaje, natural, disciplina, recuperación, información, información, personalnacimiento1943, países, bajos. Cornelius Joost van Rijsbergen Roterdam 1943 mas conocido como Keith van Rijsbergen es un informatico teorico informatologo e investigador del procesamiento del lenguaje natural y de la disciplina Recuperacion de informacion Keith van RijsbergenInformacion personalNacimiento1943 Paises Bajos Paises Bajos RoterdamNacionalidadholandesaLengua maternaInglesEducacionEducado enUniversidad de Australia OccidentalUniversidad de CambridgeSupervisor doctoralJohn Kenneth Montague MoodyInformacion profesionalOcupacioninformatico teorico informatologoConocido porTecnica de clusters Modelo probabilistico de Recuperacion de informacion Procesamiento del lenguaje naturalMiembro deAssociation for Computing MachineryDistincionesPremio Tony Kent 2004 Premio Gerard Salton 2006 editar datos en Wikidata Indice 1 Biografia 2 Obra cientifica Las tecnicas de cluster 3 Obras y reconocimientos 4 Obras de referencia 5 Enlaces externosBiografia EditarNace en Roterdam Holanda y durante su ninez y juventud vivio en distintos paises como Holanda Indonesia Namibia y finalmente Australia Realiza estudios universitarios en Western Australia donde empieza a interesarse por las matematicas En 1972 es investido como doctor por la Universidad de Cambridge con una tesis sobre programacion informatica Hasta 1975 permanece en la Universidad de Monash estudiando la inteconexion entre la Inteligencia artificial y la Recuperacion de informacion Vuelve al Laboratorio de Informatica de Cambridge como miembro honorario fellowship de la Royal Society Information Research En 1980 ocupa la catedra de informatica de la Universidad de Dublin y en 1986 se integra a la Universidad de Glasgow para dirigir el grupo de investigacion en Recuperacion de informacion En 1993 fue designado como redactor jefe de la revista cientifica The Computer Journal hasta 2000 Obra cientifica Las tecnicas de cluster EditarDesde 1969 Rijsbergen lleva investigando la base teorica de los sistemas de recuperacion de informacion dotandola de solidos principios Definio la diferencia entre Recuperacion de datos y Recuperacion de informacion distinguiendo la primera como un proceso de obtencion de datos exactos y concretos y la segunda como un proceso basado en una inferencia inductiva es decir buscar fechas o nombres es recuperacion de datos mientras que buscar temas seria recuperacion de informacion Durante la decada de los 70 y principio de los 80 ideo las tecnicas de cluster tambien llamadas clustering o clasificacion automatica Son tecnicas estadisticas multivariantes que se utilizan para hacer agrupaciones de objetos similares en un espacio multidimensional Las similitudes pueden ser calculadas entre pares de documentos basandose en el numero de descriptores que tienen en comun La aplicacion en una base de datos documental dara como resultado el agrupamiento de documentos que tengan un gran numero de terminos en comun Estas tecnicas tambien son aplicadas a descriptores cuyas similitudes nos permiten identificar relaciones semanticas entre terminos Este metodo resulta muy util para construir tesauros Las tecnicas de cluster se apoyan en los algoritmos de indizacion ponderada que ya diseno Karen Sparck Jones Esta indizacion automatizada considera mediante conclusiones estadisticas que terminos representan mejor los contenidos de un documento Esto daria fin al dilema conocido como conflicto de Rijsbergen cuanto mas terminos del documento esten disponibles para la equiparacion mas facil el documentos sera equipado en una busqueda pero mas dificil distinguirlo de otros documentos Rijsbergen planteo ademas dos hipotesis Hipotesis de cluster donde definia que documentos similares tienden a ser relevantes para las mismas preguntas y por tanto ser util para agrupar documentos relevantes para un peticion concreta Esta aplicacion permitiria realizar busquedas de alta precision en una base de datos documental previamente clasificada Hipotesis de asociacion donde dice que un termino de indizacion es bueno para discriminar documentos relevantes de aquellos que no lo son cualquier termino de indizacion estrechamente relacionado con ese es probablemente tan bueno como ese El uso de estas tecnias fue empleado dentro del modelo probabilistico de recuperacion de informacion en redes de inferencia bayesiana y en tecnicas de retroalimentacion por relevancia A mediados de los 80 comenzo a abordar la investigacion a traves de los modelos cognitivos de recuperacion de informacion Esto modelos otorgan al usuario una importancia mayor al tener en cuenta tanto la formacion del usuario como a la naturaleza y propiedades de sus busquedas Rijsbergen utilizo el principio de incertidumbre logica al considerar que una coleccion documental no es en su conjunto ni completa y coherente para los usuarios llegando incluso a haber elementos contradictorios entre si Propuso un paradigma nuevo donde el proceso de recuperacion sea considerado como un proceso de inferencia incierta y las consultas y los documentos puedan ser representados como declaraciones logica probabilisticas Obras y reconocimientos EditarEn 1975 publico Information retrieval obra con abundante material original sobre el modelo probabilistico ademas de aportar reformulaciones originales de trabajos de otros autores Es considerado como un texto clasico de la materia Ha sido editado tambien en CD En 1999 publicaria en coautoria con Crestani y Lalmas Recuperacion de informacion la incertidumbre y la logica donde trataria sus aportaciones en logica inferencial Tambien ha publicado numerosos articulos en prestigiosas revistas cientificas Ha sido premiado con el Premio Tony Kent en 2004 y el Premio Gerard Salton 2006 Es miembro del Institut of Electrical Engineers IEE de la British Computer Society BCS y de la Association of Computing Machinery ACM SIGIR Obras de referencia EditarMOYA ANEGoN Felix de 2002 Tecnicas avanzadas de recuperacion documental En Manual de Ciencias de la Documentacion Madrid Piramide Enlaces externos EditarNombramiento de Rijsbergen como Fellow de la Association of Computing Machinery ACM SIGIR Premios Gerard Salton Datos Q92667 Obtenido de https es wikipedia org w index php title Keith van Rijsbergen amp oldid 144873145, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos