fbpx
Wikipedia

Web semántica

La web semántica (del inglés semantic web) es un conjunto de actividades desarrolladas en el seno de World Wide Web Consortium con tendencia a la creación de tecnologías para publicar datos legibles por aplicaciones informáticas (máquinas en la terminología de la Web semántica).[1]​ Se basa en la idea de añadir metadatos semánticos y ontológicos a la World Wide Web. Esas informaciones adicionales —que describen el contenido, el significado y la relación de los datos— se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento. El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.

El precursor de la idea, Tim Berners-Lee, intentó desde el principio incluir información semántica en su creación, la World Wide Web, pero por diferentes causas no fue posible.[2]​ Por ese motivo introdujo el concepto de semántica con la intención de recuperar dicha omisión.

Antecedentes

El precursor de la idea de enlaces web de hipertexto fue Vannevar Bush (1890 - 1974), ingeniero y profesor del Massachusetts Institute of Technology (MIT) y asesor, durante la Segunda Guerra Mundial, de Investigación Científica y Desarrollo en la administración americana siendo presidente Roosevelt. En 1945 describió la primera aplicación hipertextual, un proyecto llamado MeMex Memory Extended y descrito en As We May Think, ( publicado en la revista Atlantic Monthly.[3]

La idea presentada era la de un sistema distribuido de información accesible a través de un escritorio (interfaz), en el que los archivos de texto e imagen estuvieran ligados y pudieran ser consultados a través de los enlaces. Así los usuarios podrían visualizar la información a través de distintos recorridos.[4]​ Este proyecto es lo que puede considerarse el origen del hipertexto.

En la década de los años 60 Theodor Nelson acuñó el término Hypertext como “non-sequential writing”, una escritura no secuencial. Se trata de un conjunto de bloques de texto conectados entre sí mediante unos enlaces que permiten navegar de un texto a otro.[5]

Paralelamente, Douglas Carl Engelbart, del centro Augmentation Research Center (ARC) de la Universidad de Stanford, trabajó sobre la idea de Vannevar Bush, desarrollando un software capaz de implementar hipertexto o referencias cruzadas automáticas a otros documentos. El proyecto oN Line System (NLS) consistía en un sistema de navegación en línea, una red local que enlazaba los documentos publicados por el instituto, para poder acceder a ellos y trabajar en grupo.[6]

Basándose en estos proyectos, fueron surgiendo numerosos sistemas de hipertexto. Como Hypertext Editing System (HES) en 1967 por IBM y la Brown University, File Retrieval and Editing System (FRESS) en 1968, ZOG en 1972 de la Carnegie Mellon University, Knowledge Management System (KMS) en 1983, Intermedia en 1985 en la Brown University, Note Cards en 1985 por la Xerox Parc o Smar Text en 1988.[7]

En 1990 Tim Berners - Lee y Robert Cailliau dieron a conocer la web como la conocemos actualmente. Presentaron el proyecto World Wide Web (WWW) en la Organización Europea para Investigación Nuclear (CERN) en Ginebra (Suiza), que constituyó la primera propuesta de web. Consistía en un programa cliente (navegador/editor) basado en el lenguaje de etiquetas de hipertexto HTML (Hyper Text Markup Language), junto con el protocolo de transferencia de hipertexto HTTP (Hyper Text Transfer Protocol), lenguaje que los ordenadores usan para comunicarse por Internet, y el identificador uniforme de recursos digitales URI (Uniform Resource Identifier), para la localización de objetos digitales. El navegador/editor World Wide Web era capaz de seguir vínculos en los archivos de los servidores HTTP.[7]

El W3C empieza a plantearse la idea de web semántica a finales de los años 90, aunque hasta 2001 no se presenta un artículo en la revista Scientific American en el que se exhiben los postulados de la web semántica. La propuesta de Tim Berners- Lee en 2001 pretende transformar la actual web. La web actual se basa en el lenguaje natural, tiene una falta de estructuración de contenidos y una carencia de descripciones normalizadas para los recursos digitales, lo que se ve reflejado en la ambigüedad de los resultados que recuperan los motores de búsqueda generalistas.[8]

Como consecuencia, para resolver el actual problema de accesibilidad a la información en Internet, surge la idea de web semántica, cuyo objetivo es identificar la información de forma unívoca y establecer relaciones entre los objetos digitales con miras a facilitar una recuperación eficaz de la información.

Puntos fundamentales

La Web Semántica se basa en dos puntos fundamentales:

a) La descripción del significado. Donde se definen los conceptos

b) La manipulación automática de estas descripciones. Se efectúa mediante lógica y motores de inferencia.

En la descripción del significado se articula la semántica, los metadatos y las ontologías.[9]

  • La semántica. Es el estudio del significado de los términos lingüísticos.

En nuestro contexto de la Web Semántica, se pretende dotar de significado interpretable por parte de las máquinas, como información adicional que pueda ser comprendida y procesada por una computadora.

  • Los metadatos. Son datos que describen otros datos, en este contexto los datos que describen recursos de la web.

La distinción entre datos y metadatos es relativa, pues depende de la aplicación. Los metadatos de una aplicación pueden ser los datos que maneja otra aplicación.

  • Las ontologías. Una ontología es una jerarquía de conceptos con atributos y relaciones, que define una terminología consensuada para definir redes semánticas de unidades de información interrelacionadas y con ciertas reglas.[10]

Una ontología se puede definir como una «especificación explícita y formal de una conceptualización compartida» según (Gruber, 1993) de esta manera:[11]

  • Es explícita, porque define los conceptos, propiedades, relaciones, funciones, axiomas y restricciones que la componen.
  • Es formal, porque es legible e interpretable por las máquinas.
  • Es una conceptualización, porque es un modelo abstracto y una vista simplificada de las entidades que representa.
  • Finalmente, es compartida porque ha habido un consenso previo sobre la información que ha sido acordado por un grupo de expertos.

Ventajas de la Web semántica

  • Incorpora contenido semántico a las páginas que se suben a Internet. Esto permite una mejor organización de la información, asegurando búsquedas más precisas por significado y no por contenido textual.
  • Permite a las computadoras la gestión de conocimiento, hasta el momento reservada a las personas (hace uso de inteligencia artificial).[12]

Desventajas de la Web semántica

  • Es costoso y laborioso adaptar los documentos de Internet, para poder ser procesados de forma semántica (a esto hay que sumar los problemas del idioma).
  • Es necesario unificar los estándares semánticos y proveer relaciones de equivalencia entre conceptos. Por ejemplo, en el caso del código postal, se debe establecer que CP es igual a ZC “zip code” en el caso del inglés.[12]

Web 3.0

En cuanto a la web 3.0, y sus otras acepciones como web de datos y web semántica, existe bastante controversia en la literatura a la hora de establecer semejanzas o diferencias entre los conceptos. Para Küster y Hernández (2013) la web semántica forma parte de la web 3.0.[13]

Sin embargo, Tim Berners-Lee ha descrito la web semántica como un componente de la "Web 3.0".[14]

Sin embargo el W3C, organismo que lleva la iniciativa y desarrolla esta web, emplea las acepciones web de datos y web semántica, para hacer referencia a la web de datos enlazados y las tecnologías semánticas que emplea para hacerla efectiva.[15]

El enfoque del W3C se centra en los datos, y gira en torno a la cada vez mayor cantidad de datos existentes que se encuentran aislados en silos, y en cómo conectarlos.[16]

Relación con Internet

La web semántica es una ampliación de la Web, por medio de la que se intenta realizar un filtrado de manera automática pero precisa de la información. Es necesario hacer que la información que anida en la web sea entendible por las propias máquinas. En concreto se atiende a su contenido, independientemente de la estructura sintáctica. O lo que es lo mismo, se atiende a diferentes ámbitos, se tiene en cuenta el conjunto de lenguajes, a la vez que los procedimientos para poder añadir esa semántica a la información para que, de esta manera, sea entendible por los agentes encargados de procesarla. Además, se tiene en cuenta el desarrollo y la construcción de los agentes encargados de procesar esa información y de filtrar adecuadamente cuál de todas ellas es la útil para los usuarios o para los agentes que tienen que realizar una función concreta. Con todo ello, los agentes deben recuperar y manipular la información pertinente, lo que requiere una integración sin fracturar la web, pero sin dejar de aprovechar totalmente las infraestructuras que existen. En concreto, a través de esta modalidad de web semántica se pueden obtener soluciones a problemas habituales en la búsqueda de información gracias a la utilización de una infraestructura o proceso común, mediante la cual, es posible compartir, procesar y transferir información de forma sencilla.

En la actualidad, la World Wide Web está basada principalmente en documentos escritos en HTML, un lenguaje de marcado que sirve principalmente para crear hipertexto en Internet. El lenguaje HTML es válido para adecuar el aspecto visual de un documento e incluir objetos multimedia en el texto (imágenes, esquemas de diálogo, etc.). Pero ofrece pocas posibilidades para categorizar los elementos que configuran el texto más allá de las típicas funciones estructurales, como sucede con otros lenguajes de maquetación (tipo LaTeX).

HTML permite mediante una herramienta de visualización (como un navegador o un agente de usuario) mostrar por ejemplo un catálogo de objetos en venta. El código HTML de este catálogo puede explicitar aspectos como "el título del documento es Ferretería Acme"; pero no hay forma de precisar dentro del código HTML si el producto M270660 es una "batería Acme", con un "precio de venta al público" de 200 €, o si es otro tipo de producto de consumo (es decir, es una batería eléctrica y no un instrumento musical, o un puchero). Lo único que HTML permite es alinear el precio en la misma fila que el nombre del producto. No hay forma de indicar "esto es un catálogo", "batería Acme" es una batería eléctrica, o "200 €" es el precio. Tampoco hay forma de relacionar ambos datos para describir un elemento específico en oposición a otros similares en el mismo catálogo.

La web semántica se ocuparía de resolver estas deficiencias. Para ello dispone de tecnologías de descripción de los contenidos, como RDF y OWL, además de XML, el lenguaje de marcado diseñado para describir los datos. Estas tecnologías se combinan para aportar descripciones explícitas de los recursos de la web (ya sean estos catálogos, formularios, mapas u otro tipo de objeto documental). De esta forma el contenido queda desvelado, como los datos de una base de datos accesibles por web, o las etiquetas inmersas en el documento (normalmente en XHTML, o directamente en XML, y las instrucciones de visualización definidas en una hoja de estilos aparte). Esas etiquetas permiten que los gestores de contenidos interpreten los documentos y realicen procesos inteligentes de captura y tratamiento de información.[17]

Según Codina y Rovira (2006), en el proyecto de la Web Semántica conviven 2 grandes visiones, por lo que se proponen 2 definiciones: 1- La visión de la inteligencia artificial: la Web Semántica es un conjunto de iniciativas destinadas a promover una futura web cuyas páginas estén organizadas, estructuradas y codificadas de tal manera que los ordenadores sean capaces de efectuar inferencias y razonar a partir de sus contenidos. 2- La visión del procesamiento robusto: la Web Semántica es un conjunto de iniciativas destinadas a convertir www en una gran base de datos capaz de soportar un procesamiento sistemático y consistente de la información.

Retos

Algunos de los retos de la Web Semántica incluyen amplitud, vaguedad, incertidumbre, inconsistencia y engaño. Los sistemas de razonamiento automatizado tendrán que lidiar con todos estos temas con la finalidad de cumplir con la promesa de la Web Semántica.

  • Inmensidad: La World Wide Web contiene miles de millones de páginas. La ontología de la terminología médica de SNOMED por sí sola contiene 370.000 nombres de las clases, y la tecnología para eliminar todos los términos semánticamente duplicados todavía no está disponible. Cualquier sistema de razonamiento automatizado tendrá que enfrentar verdaderamente a enormes entradas.
  • Indistinción: Estos son conceptos imprecisos como “jóvenes” o “altos". Esto surge de la indeterminación en las consultas de los usuarios de los conceptos representados por los proveedores de contenidos, de emparejar términos de consulta a los términos de servicios y de tratar de combinar diferentes bases de conocimiento con la superposición de conceptos pero sutilmente diferentes. La lógica difusa es la técnica más común para hacer frente a la indistinción.
  • Incertidumbre: Estos son conceptos precisos con los valores inciertos. Por ejemplo, un paciente puede presentar un conjunto de síntomas que corresponden a un número distinto de diagnósticos diferentes, cada uno con una probabilidad diferente. Técnicas de razonamiento probabilístico se emplean generalmente para hacer frente a la incertidumbre.
  • La inconsistencia: Estas son contradicciones lógicas que inevitablemente surgirán durante el desarrollo de grandes ontologías, y cuando las ontologías se combinan a partir de fuentes separadas. El razonamiento deductivo falla catastróficamente cuando se enfrentan a la incoherencia, ya que "nada se deduce de una contradicción". El razonamiento rebatible y razonamiento paraconsistente son técnicas que pueden emplearse para hacer frente a la inconsistencia.
  • El Engaño: Es cuando el productor de la información es intencionalmente engañoso al consumidor de la información, las técnicas de criptografía se utilizan actualmente para mitigar esta amenaza.

Esta lista de retos es ilustrativa más que exhaustiva, y se centra en los desafíos a la "lógica unificadora" y las capas de "prueba" de la Web Semántica.

El World Wide Web Consortium (W3C). En el informe final del Grupo incubador para razonamiento de incertidumbre para la World Wide Web (URW3-XG) agrupa estos problemas bajo el mismo epígrafe de "incertidumbre". Muchas de las técnicas mencionadas aquí requerirán extensiones de la Web Ontology Language (OWL), por ejemplo, para anotar las probabilidades condicionales. Actualmente esta es un área de investigación activa.[18]

Barreras

El desarrollo y difusión masivos de la web semántica tiene algunas dificultades que no ha podido superar todavía: una de ellas es tecnológica y la otra está relacionada con la falta de interés de los propietarios de las páginas web.

Las tecnologías para expresar la información en el formato que requiere una web semántica existen hace años. Quizás la componente más especializada sea OWL, que existe como estándar del W3C desde 2004. El componente tecnológico que falta es el que permita convertir de forma automática el abundante contenido de texto de las páginas web en marcas OWL. La web semántica requiere que los creadores de las páginas web traduzcan "a mano" su contenido en marcas OWL, para que pueda ser interpretado por agentes semánticos. Pero esto es inviable debido al gran volumen que tiene la Web y su imparable crecimiento, razón por la que hay que plantear procesos de anotación (por lo menos) semi-automáticos.[19]​ Afortunadamente muchas páginas (aunque no representen un porcentaje elevado de todas las páginas del mundo) tienen información formateada en su base de datos, y pueden realizar esta conversión de manera automática. Por ejemplo, un sitio con miles de fichas de películas, que incluyen datos como título, director, fecha de estreno, tiene estos datos prolijamente ordenados y clasificados en una base de datos, lo que les permite elaborar un traductor de "ficha de película" a OWL, que sirva para todas las fichas, sin necesidad de tener que realizar la traducción a mano para cada una.

La otra barrera que se opone pasivamente a la web semántica es el modelo de negocio de gran cantidad de páginas web, que obtienen ingresos de la publicidad. Estos ingresos son posibles únicamente si sus páginas son visitadas por una persona, y se pierden si los datos quedan disponibles para que los interprete un proceso automático.

El siguiente ejemplo arbitrario y parcial ilustra este concepto: para un trabajo de investigación para la escuela sobre la vida de un prócer, un sistema semántico realiza la investigación y presenta en pantalla el resultado: fecha de nacimiento y defunción, batallas en las que participó, hechos destacados, frases célebres, y todo esto sin necesidad de acceder a ninguna página web específica, y por lo tanto sin consumir la publicidad de los sitios que pusieron a disposición esa información.

La visión no debe encerrarse en estos términos. Es muy probable que, de surgir una web semántica masiva, el modelo de negocios se adapte. Sin embargo, mientras no haya indicios de que esto vaya a suceder de manera inevitable e inminente, no es lógico suponer que los sitios web basados en publicidad apoyen su desarrollo poniendo su información en el formato necesario.

Avances

Actualmente, existen nichos piloto que han comenzado con la transformación hacia la web semántica:

  • Sistemas de datos abiertos gubernamentales en varios países, se encuentran en formato RDF.
  • Datos Abiertos en la Biblioteca Nacional de España > datos.bne.es
  • Datos Abiertos en la Biblioteca Nacional de Francia > data.bnf.fr
  • Intranets de conocimiento de empresas multinacionales.
  • Incorporación de metadatos en sistemas de comercio electrónico.
  • Resultados semánticos en el motor de búsquedas Google.
  • Datos Abiertos en la Biblioteca Virtual Miguel de Cervantes.

Las actividades de investigación sobre las aplicaciones corporativas

El primer grupo de investigación enfocado explícitamente en el corporativo de la Web Semántica ha sido el equipo de ACACIA en la INRIA-Sophia-Antipolis, fundada en 2002. Los resultados de su trabajo son el RDF (S) del motor de búsqueda basado Corese, y la aplicación de la tecnología de web semántica en el ámbito del E-learning.[20]

Desde 2008 el grupo corporativo de investigación de la Web Semántica que se encuentra en la Universidad Libre de Berlín, se centra en bloques de construcción: Búsqueda semántica Corporativa, Colaboración empresarial Semántica y la Ingeniería Ontológica corporativa.[21]

La investigación en ingeniería ontología incluye la cuestión de cómo involucrar a los usuarios no expertos en la creación de ontologías y contenido semánticamente anotada para la extracción de conocimiento explícito de la interacción de los usuarios dentro de las empresas.[22]

Normas

La normalización para la Web Semántica, en el contexto de la Web 3.0, está bajo el cuidado del W3C.

Componentes de la Web Semántica

 
Arquitectura tecnológica de la Web Semántica

Los principales componentes de la Web Semántica son los metalenguajes y los estándares de representación XML, XML Schema, RDF, RDF Schema y OWL, así como el lenguaje SPARQL para la consulta de datos RDF.[23]​ La OWL Web Ontology Language Overview describe la función y relación de cada uno de estos componentes de la Web Semántica:

  • XML aporta la sintaxis superficial para los documentos estructurados, pero sin dotarles de ninguna restricción sobre el significado.
  • XML Schema es un lenguaje para definir la estructura de los documentos XML.
  • RDF es un modelo de datos para los recursos y las relaciones que se puedan establecer entre ellos. Aporta una semántica básica para este modelo de datos que puede representarse mediante XML.
  • RDF Schema es un vocabulario para describir las propiedades y las clases de los recursos RDF, con una semántica para establecer jerarquías de generalización entre dichas propiedades y clases.
  • OWL es un lenguaje para definir ontologías mediante la descripción detallada de propiedades y clases: tales como relaciones entre clases (p.ej. disyunción), cardinalidad (por ejemplo "únicamente uno"), igualdad, tipologías de propiedades más complejas, caracterización de propiedades (por ejemplo simetría) o clases enumeradas.
  • SPARQL es un lenguaje de consulta de conjuntos de datos RDF. Además en dicha especificación también se incluye un formato XML que detalla el modo en el que se estructuran los resultados obtenidos.

La usabilidad y aprovechamiento de la Web y sus recursos interconectados puede aumentar con la web semántica gracias a:

  • Los documentos etiquetados con información semántica (compárese ésta con la etiqueta <meta> de HTML, usada para facilitar el trabajo de los robots). Se pretende que esta información sea interpretada por el ordenador con una capacidad comparable a la del lector humano. El etiquetado puede incluir metadatos descriptivos de otros aspectos documentales o protocolarios.
  • Vocabularios comunes de metadatos (Ontología (Informática)) y mapas entre vocabularios que permitan a quienes elaboran los documentos disponer de nociones claras sobre cómo deben etiquetarlos para que los agentes automáticos puedan usar la información contenida en los metadatos (p.ej. el metadato author tenga el significado de "autor de la página" y no el del "autor del objeto descrito en la página").
  • Agentes automáticos que realicen tareas para los usuarios de estos metadatos de la Web Semántica
  • Servicios Web (a menudo con agentes propios) que provean de información a los agentes (por ejemplo un servicio de garantías a quien un agente pudiera consultar sobre si un comercio electrónico tiene un historial de mal servicio o de generar correo basura).

Los proveedores primarios de esta tecnología son las URIs que identifican los recursos junto con XML y los namespaces. Si a esto se añade un poco de lógica, mediante una RDF, u otras tecnologías como los mapas temáticos y algo de razonamiento basado en técnicas de inteligencia artificial, Internet podría estar cerca de alcanzar las aspiraciones iniciales de su inventor, Tim Berners-Lee.

Estado actual de la normalización

Normas bien establecidas:

  • RDF

Todavía no se ha realizado plenamente:

  • La unificación de la lógica y las capas de prueba.
  • Semantic Web Rule Language (SWRL).

Aplicaciones

La intención es mejorar la usabilidad y utilidad de la Web y sus recursos interconectados mediante la creación de servicios Web Semánticos, tales como:

• Los servidores que exponen a los sistemas de datos existentes utilizando los estándares RDF y SPARQL. Muchos convertidores a RDF existen desde diferentes aplicaciones. Las bases de datos relacionales son una fuente importante. El servidor web semántico se conecta al sistema existente sin afectar a su funcionamiento.

• Documentos "marcados" con información semántica (una extensión del HTML <meta> etiquetas utilizadas en las páginas web de hoy en día para suministrar información para los motores de búsqueda utilizando los rastreadores web). Esta información podría ser legible por máquina sobre el contenido humano-comprensible del documento (como el creador, título, descripción, etc.) o puede ser puramente metadatos que representen una serie de factores (tales como los recursos y servicios en otros lugares en el sitio). Se debe de tener en cuenta que cualquier cosa que pueda ser identificado con un identificador uniforme de recursos (URI) puede ser descrito, por lo que la web semántica puede razonar acerca de los animales, personas, lugares, ideas, etc. Hay cuatro formatos de anotación semántica que se pueden utilizar en los documentos HTML; microformato, RDFa de microdatos y JSON-LD.[24]​ El marcado semántico se genera regularmente de manera automática, en lugar de forma manual.

• Vocabularios de metadatos común (ontologías) y mapas entre vocabularios que permiten que los creadores de documentos sepan cómo marcar sus documentos para que los agentes puedan utilizar la información de los metadatos suministrados (de este modo un autor en el sentido de que el autor de la página no se confundirá con autor en el sentido de un libro que es objeto de una reseña).

• Agentes automatizados para realizar tareas para los usuarios de la Web Semántica que utilizan estos datos.

• Servicios basados en la web (a menudo con agentes propios) para suministrar información específica a los agentes, por ejemplo, un servicio de confianza que un agente podría preguntar si alguna tienda en línea tiene una historia de un mal servicio o envío de correo spam.

Estos servicios podrían ser útiles para los motores de búsqueda públicos, o que pueden ser utilizados para la gestión del conocimiento dentro de una organización.

Las aplicaciones de negocios incluyen:

• Facilitar la integración de la información procedente de fuentes mixtas.

• Ambigüedades de disolución en la terminología corporativa.

• El mejoramiento de la recuperación de información lo que reduce la sobrecarga de información.

• La identificación de información relevante con respecto a un determinado dominio.[25]

• Proporcionar apoyo de toma de decisiones

En una corporación, no es un grupo cerrado de usuarios y la gestión es capaz de cumplir los lineamientos de la empresa, como la adopción de determinadas ontologías y el uso de la anotación semántica. En comparación con la Web Semántica pública hay menos requisitos de escalabilidad y la información que circula dentro de una empresa pueden ser generalmente más confiable; la privacidad es un problema menor fuera del manejo de datos de los clientes.

La censura y la privacidad

El entusiasmo sobre la web semántica podría ser atemperada por preocupaciones con respecto a la censura y la privacidad, por ejemplo, las técnicas de análisis de un texto pueden ahora ser fácilmente sobrepasadas mediante el uso de otras palabras, metáforas por ejemplo, o mediante el uso de imágenes en lugar de palabras. Una implementación avanzada de la Web Semántica haría más fácil para los gobiernos controlar la visualización y creación de información en línea, ya que esta información sería mucho más fácil de entender para una máquina automatizada de bloqueo de contenidos. Además, la cuestión se ha planteado también que, con el uso de FOAF archivos y geolocalización de metadatos, habría muy poco anonimato asociado en la autoría de artículos por ejemplo un blog personal. Algunos de estos problemas fueron abordados en el proyecto "Política Consciente Web"[26]​ y es un tema activo de investigación y desarrollo.

Web Semántica y Web 3.0

Erróneamente se identifican los conceptos de Web semántica y Web 3.0 La Web Semántica es un conjunto de actividades, tal y como indica el propio World Wide Web Consortium,[27]​ al amparo de las cuales se han desarrollado un conjunto de tecnologías que se aplican en muchos ámbitos: redes sociales, publicación de datos, realización de inferencias, marcado semántico de documentos convencionales, etc. Por su parte la Web 3.0 se refiere a un entorno en el que aplicaciones y agentes de usuario[28]​ intercambian datos, los procesan e incluso realizan procesos de inferencias para generar nueva información.[29]

Véase también

Bibliografía

  • Codina, L., Marcos, M.C., Pedraza, R. (coords.) (2006). Web semántica y sistemas de información documental. Gijón: TREA. ISBN 9788497044608

Referencias

  1. "The Semantic Web is a web of data. There is lots of data we all use every day, and it is not part of the web. I can see my bank statements on the web, and my photographs, and I can see my appointments in a calendar. But can I see my photos in a calendar to see what I was doing when I took them? Can I see bank statement lines in a calendar? Why not? Because we don't have a web of data. Because data is controlled by applications, and each application keeps it to itself. The Semantic Web is about two things. It is about common formats for integration and combination of data drawn from diverse sources, where on the original Web mainly concentrated on the interchange of documents. It is also about language for recording how the data relates to real world objects. That allows a person, or a machine, to start off in one database, and then move through an unending set of databases which are connected not by wires but by being about the same thing." W3C Semantic Web Activity
  2. Andy Carvin. "" Digital divide network artículos, 2005.
  3. Vianello Osti, Marina. (2004). El hipertexto entre la utopía y la aplicación: identidad, problemática y tendencias de la Web. Gijón: TREA. p. 360
  4. Bush, Vannevar. (1945). As We May Think. En: The Atlantic Montly. 176 (1). Recuperado el 7 de mayo de 2016 de: http://www.theatlantic.com/magazine/archive/1945/07/as-we-may-think/303881/
  5. Nelson, Theodor. Literary Machines. Sausalito (CA): Mindful Press. Recuperado el 30 de abril de 2016 de: http://u-tx.net/ccritics/literary-machines.html
  6. Lamarca Lapuente, María Jesús. (2013). Hipertexto, el nuevo concepto de documento en la cultura de la imagen. Madrid: Universidad Complutense de Madrid. Tesis de doctorado en Ciencias de la Información. Recuperado el 6 de mayo de 2016 de: http://www.hipertexto.info/
  7. Berners-Lee, Tim. (2000). Tejiendo la Red: el inventor del World Wide Web nos descubre su origen. Madrid: siglo XXI de España editores. p. 254
  8. Vallez, Mari; Rovira, Cristòfol; Codina, Lluís; Pedraza, Rafael. (2010). “Procedimientos para la extracción de palabras clave de páginas web basados en criterios de posicionamiento en buscadores. En: Anuario Hypertext.net. n.8. Recuperado el 7 de mayo de 2016 de: http://www.upf.edu/hipertextnet/numero-8/extraccion_keywords.html
  9. Chávez E. María; Cárdenas Oscar & Benito, Oscar. (2014). La Web Semántica. En: Revista De Investigación de Sistemas E Informática. 2(3). pp. 43-54. Recuperado el 6 de mayo de 2016 de: http://revistasinvestigacion.unmsm.edu.pe/index.php/sistem/article/view/3477
  10. Ontologías. (2001). http://www.ontology.org
  11. Gruber, Tom R. (1993). Toward Principles for the Design of Ontologies Used for Knowledge Sharing. En: Technical Report KSL-93-04, California: Knowledge Systems Laboratory; Stanford University. Recuperado el 30 de abril de 2016 de: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.91.6025&rep=rep1&type=pdf
  12. Salazar Argonza, Javier (2011). Estado actual de la Web 3.0 o Web Semánticas. En: Revista Digital Universitaria, 12 (11). Recuperado el 7 de mayo de 2016 de: http://www.revista.unam.mx/vol.12/num11/art108/index.html ISSN 1607-6079.
  13. Küster Boluda, Inés; Hernández Fernández, Asunción. (2013). De la Web 2.0 a la Web 3.0: antecedentes y consecuencias de la actitud e intención de uso de las redes sociales en la web semántica. En: Universia Business Review, nº. 37, pp. 104-119. Recuperado el 7 de mayo de 2016 de: http://www.redalyc.org/articulo.oa?id=43325648006
  14. Victoria Shannon (2006). A 'more revolutionary' Web. En: The New York Time. Recuperado el 8 de mayo de 2016 de: http://www.nytimes.com/2006/05/23/technology/23iht-web.html?_r=0
  15. World Wide Web Consortium (W3C). (2013). Semantic Web. Recuperado el 8 de mayo de 2016 de: http://www.w3.org/standards/semanticweb/
  16. Álvarez, Martín. El W3C y la web semántica (2012). En: VII Feria de Tiendas Virtuales, Huesca 17 de Abril. Recuperado el 10 de mayo de 2016 de: http://www.w3c.es/Presentaciones/2012/0417-WebSemantica-MA/0417-WebSemantica-MA.pdf
  17. Reig, Dolors. "Llega con fuerza la Web Contextual." Editado el 25 de Diciembre 2008. Acceso 27 de febrero de 2011.
  18. Lukasiewicz, Thomas; Umberto Straccia. (2008). Managing uncertainty and vagueness in description logics for the Semantic Web. En: Semantic Web Challenge. 6 (4), pp. 291–308.
  19. Luis Criado-Fernández. Nosotros los constructores de la Web Semántica en Wayback Machine.. Junio 2013. ISBN 978-84-616-0515-6
  20. Buffa, Michel; Dehors, Sylvain; Faron-Zucker, Catherine; Sander, Peter (2005). Towards a Corporate Semantic Web Approach in Designing Learning Systems: Review of the Trial Solutioins Project. En: International Workshop on Applications of Semantic Web Technologies for E-Learning. Amsterdam, Holland. pp. 73–76.
  21. Paschke, Adrian. Corporate Semantic Web. Freie Universität Berlin. Recuperado el 7 de mayo de 2016 de: http://www.corporate-semantic-web.de
  22. Hinze, Annika; Heese, Ralf; Luczak-Rösch, Markus; Paschke, Adrian (2012). “Semantic Enrichment by Non-experts: Usability of Manual Annotation Tools". En: ISWC'12 - Proceedings of the 11th international conference on The Semantic Web. Boston, USA. pp. 165–181.
  23. Juan Antonio Pastor Sánchez. Tecnologías de la Web Semántica. Barcelona: Editorial UOC, 2011. ISBN 978-84-9788-474-7
  24. Sikos, Leslie F. (2015). Mastering Structured Data on the Semantic Web: From HTML5 Microdata to Linked Open Data. En: Apress. p. 256. Recuperado el 11 de mayo de 2016 de: http://www.apress.com/9781484210505 ISBN 1484210492
  25. Kuriakose, John. (2009). Understanding and Adopting Semantic Web Technology. En: Cutter IT Journal (CUTTER INFORMATION CORP.) 22 (9). pp. 10–18.
  26. Hendler, Jim. (2003). Policy Aware Web Project. En: Maryland information and network dynamics lab semantic web agents Project. Recuperado el 7 de mayo de 2016 de: http://www.cs.rpi.edu/~hendler/presentations/PolicyAware.pdf
  27. «http://www.w3.org/2001/sw/». 
  28. Lasilla, Ora; Hendler, James (2007). . IEEE Computer Society.
  29. "Conrad Wolfram on Communicating with apps in web 3.0", IT PRO, 17 Mar 2010.

Enlaces externos

  • (2003) . Universidad Autónoma de Madrid
  • Carolina García Cataño y David Arroyo Menéndez (2002) Biblioteca Digital y Web Semántica
  • Procedimiento semi-automático para transformar la web en web semántica (Tesis doctoral, Luis Criado-Fernández , 2009 UNED)The Semantic Web: An Introduction (en inglés)
  • Presentación: Construyendo la web semántica
  • Entidades SEO. El SEO semántico por Juan José Fdez Juan
  • Estructura de una página web y etiquetas semánticas (tabla)
  •   Datos: Q54837
  •   Multimedia: Semantic Web

semántica, semántica, inglés, semantic, conjunto, actividades, desarrolladas, seno, world, wide, consortium, tendencia, creación, tecnologías, para, publicar, datos, legibles, aplicaciones, informáticas, máquinas, terminología, basa, idea, añadir, metadatos, s. La web semantica del ingles semantic web es un conjunto de actividades desarrolladas en el seno de World Wide Web Consortium con tendencia a la creacion de tecnologias para publicar datos legibles por aplicaciones informaticas maquinas en la terminologia de la Web semantica 1 Se basa en la idea de anadir metadatos semanticos y ontologicos a la World Wide Web Esas informaciones adicionales que describen el contenido el significado y la relacion de los datos se deben proporcionar de manera formal para que asi sea posible evaluarlas automaticamente por maquinas de procesamiento El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informaticos usando agentes inteligentes Agentes inteligentes son programas en las computadoras que buscan informacion sin operadores humanos El precursor de la idea Tim Berners Lee intento desde el principio incluir informacion semantica en su creacion la World Wide Web pero por diferentes causas no fue posible 2 Por ese motivo introdujo el concepto de semantica con la intencion de recuperar dicha omision Indice 1 Antecedentes 1 1 Puntos fundamentales 1 2 Ventajas de la Web semantica 1 3 Desventajas de la Web semantica 2 Web 3 0 3 Relacion con Internet 3 1 Retos 3 2 Barreras 3 3 Avances 3 4 Las actividades de investigacion sobre las aplicaciones corporativas 4 Normas 5 Componentes de la Web Semantica 5 1 Estado actual de la normalizacion 6 Aplicaciones 7 La censura y la privacidad 8 Web Semantica y Web 3 0 9 Vease tambien 10 Bibliografia 11 Referencias 12 Enlaces externosAntecedentes EditarEl precursor de la idea de enlaces web de hipertexto fue Vannevar Bush 1890 1974 ingeniero y profesor del Massachusetts Institute of Technology MIT y asesor durante la Segunda Guerra Mundial de Investigacion Cientifica y Desarrollo en la administracion americana siendo presidente Roosevelt En 1945 describio la primera aplicacion hipertextual un proyecto llamado MeMex Memory Extended y descrito en As We May Think Como podriamos pensar publicado en la revista Atlantic Monthly 3 La idea presentada era la de un sistema distribuido de informacion accesible a traves de un escritorio interfaz en el que los archivos de texto e imagen estuvieran ligados y pudieran ser consultados a traves de los enlaces Asi los usuarios podrian visualizar la informacion a traves de distintos recorridos 4 Este proyecto es lo que puede considerarse el origen del hipertexto En la decada de los anos 60 Theodor Nelson acuno el termino Hypertext como non sequential writing una escritura no secuencial Se trata de un conjunto de bloques de texto conectados entre si mediante unos enlaces que permiten navegar de un texto a otro 5 Paralelamente Douglas Carl Engelbart del centro Augmentation Research Center ARC de la Universidad de Stanford trabajo sobre la idea de Vannevar Bush desarrollando un software capaz de implementar hipertexto o referencias cruzadas automaticas a otros documentos El proyecto oN Line System NLS consistia en un sistema de navegacion en linea una red local que enlazaba los documentos publicados por el instituto para poder acceder a ellos y trabajar en grupo 6 Basandose en estos proyectos fueron surgiendo numerosos sistemas de hipertexto Como Hypertext Editing System HES en 1967 por IBM y la Brown University File Retrieval and Editing System FRESS en 1968 ZOG en 1972 de la Carnegie Mellon University Knowledge Management System KMS en 1983 Intermedia en 1985 en la Brown University Note Cards en 1985 por la Xerox Parc o Smar Text en 1988 7 En 1990 Tim Berners Lee y Robert Cailliau dieron a conocer la web como la conocemos actualmente Presentaron el proyecto World Wide Web WWW en la Organizacion Europea para Investigacion Nuclear CERN en Ginebra Suiza que constituyo la primera propuesta de web Consistia en un programa cliente navegador editor basado en el lenguaje de etiquetas de hipertexto HTML Hyper Text Markup Language junto con el protocolo de transferencia de hipertexto HTTP Hyper Text Transfer Protocol lenguaje que los ordenadores usan para comunicarse por Internet y el identificador uniforme de recursos digitales URI Uniform Resource Identifier para la localizacion de objetos digitales El navegador editor World Wide Web era capaz de seguir vinculos en los archivos de los servidores HTTP 7 El W3C empieza a plantearse la idea de web semantica a finales de los anos 90 aunque hasta 2001 no se presenta un articulo en la revista Scientific American en el que se exhiben los postulados de la web semantica La propuesta de Tim Berners Lee en 2001 pretende transformar la actual web La web actual se basa en el lenguaje natural tiene una falta de estructuracion de contenidos y una carencia de descripciones normalizadas para los recursos digitales lo que se ve reflejado en la ambiguedad de los resultados que recuperan los motores de busqueda generalistas 8 Como consecuencia para resolver el actual problema de accesibilidad a la informacion en Internet surge la idea de web semantica cuyo objetivo es identificar la informacion de forma univoca y establecer relaciones entre los objetos digitales con miras a facilitar una recuperacion eficaz de la informacion Puntos fundamentales Editar La Web Semantica se basa en dos puntos fundamentales a La descripcion del significado Donde se definen los conceptosb La manipulacion automatica de estas descripciones Se efectua mediante logica y motores de inferencia En la descripcion del significado se articula la semantica los metadatos y las ontologias 9 La semantica Es el estudio del significado de los terminos linguisticos En nuestro contexto de la Web Semantica se pretende dotar de significado interpretable por parte de las maquinas como informacion adicional que pueda ser comprendida y procesada por una computadora Los metadatos Son datos que describen otros datos en este contexto los datos que describen recursos de la web La distincion entre datos y metadatos es relativa pues depende de la aplicacion Los metadatos de una aplicacion pueden ser los datos que maneja otra aplicacion Las ontologias Una ontologia es una jerarquia de conceptos con atributos y relaciones que define una terminologia consensuada para definir redes semanticas de unidades de informacion interrelacionadas y con ciertas reglas 10 Una ontologia se puede definir como una especificacion explicita y formal de una conceptualizacion compartida segun Gruber 1993 de esta manera 11 Es explicita porque define los conceptos propiedades relaciones funciones axiomas y restricciones que la componen Es formal porque es legible e interpretable por las maquinas Es una conceptualizacion porque es un modelo abstracto y una vista simplificada de las entidades que representa Finalmente es compartida porque ha habido un consenso previo sobre la informacion que ha sido acordado por un grupo de expertos Ventajas de la Web semantica Editar Incorpora contenido semantico a las paginas que se suben a Internet Esto permite una mejor organizacion de la informacion asegurando busquedas mas precisas por significado y no por contenido textual Permite a las computadoras la gestion de conocimiento hasta el momento reservada a las personas hace uso de inteligencia artificial 12 Desventajas de la Web semantica Editar Es costoso y laborioso adaptar los documentos de Internet para poder ser procesados de forma semantica a esto hay que sumar los problemas del idioma Es necesario unificar los estandares semanticos y proveer relaciones de equivalencia entre conceptos Por ejemplo en el caso del codigo postal se debe establecer que CP es igual a ZC zip code en el caso del ingles 12 Web 3 0 EditarEn cuanto a la web 3 0 y sus otras acepciones como web de datos y web semantica existe bastante controversia en la literatura a la hora de establecer semejanzas o diferencias entre los conceptos Para Kuster y Hernandez 2013 la web semantica forma parte de la web 3 0 13 Sin embargo Tim Berners Lee ha descrito la web semantica como un componente de la Web 3 0 14 Sin embargo el W3C organismo que lleva la iniciativa y desarrolla esta web emplea las acepciones web de datos y web semantica para hacer referencia a la web de datos enlazados y las tecnologias semanticas que emplea para hacerla efectiva 15 El enfoque del W3C se centra en los datos y gira en torno a la cada vez mayor cantidad de datos existentes que se encuentran aislados en silos y en como conectarlos 16 Relacion con Internet EditarLa web semantica es una ampliacion de la Web por medio de la que se intenta realizar un filtrado de manera automatica pero precisa de la informacion Es necesario hacer que la informacion que anida en la web sea entendible por las propias maquinas En concreto se atiende a su contenido independientemente de la estructura sintactica O lo que es lo mismo se atiende a diferentes ambitos se tiene en cuenta el conjunto de lenguajes a la vez que los procedimientos para poder anadir esa semantica a la informacion para que de esta manera sea entendible por los agentes encargados de procesarla Ademas se tiene en cuenta el desarrollo y la construccion de los agentes encargados de procesar esa informacion y de filtrar adecuadamente cual de todas ellas es la util para los usuarios o para los agentes que tienen que realizar una funcion concreta Con todo ello los agentes deben recuperar y manipular la informacion pertinente lo que requiere una integracion sin fracturar la web pero sin dejar de aprovechar totalmente las infraestructuras que existen En concreto a traves de esta modalidad de web semantica se pueden obtener soluciones a problemas habituales en la busqueda de informacion gracias a la utilizacion de una infraestructura o proceso comun mediante la cual es posible compartir procesar y transferir informacion de forma sencilla En la actualidad la World Wide Web esta basada principalmente en documentos escritos en HTML un lenguaje de marcado que sirve principalmente para crear hipertexto en Internet El lenguaje HTML es valido para adecuar el aspecto visual de un documento e incluir objetos multimedia en el texto imagenes esquemas de dialogo etc Pero ofrece pocas posibilidades para categorizar los elementos que configuran el texto mas alla de las tipicas funciones estructurales como sucede con otros lenguajes de maquetacion tipo LaTeX HTML permite mediante una herramienta de visualizacion como un navegador o un agente de usuario mostrar por ejemplo un catalogo de objetos en venta El codigo HTML de este catalogo puede explicitar aspectos como el titulo del documento es Ferreteria Acme pero no hay forma de precisar dentro del codigo HTML si el producto M270660 es una bateria Acme con un precio de venta al publico de 200 o si es otro tipo de producto de consumo es decir es una bateria electrica y no un instrumento musical o un puchero Lo unico que HTML permite es alinear el precio en la misma fila que el nombre del producto No hay forma de indicar esto es un catalogo bateria Acme es una bateria electrica o 200 es el precio Tampoco hay forma de relacionar ambos datos para describir un elemento especifico en oposicion a otros similares en el mismo catalogo La web semantica se ocuparia de resolver estas deficiencias Para ello dispone de tecnologias de descripcion de los contenidos como RDF y OWL ademas de XML el lenguaje de marcado disenado para describir los datos Estas tecnologias se combinan para aportar descripciones explicitas de los recursos de la web ya sean estos catalogos formularios mapas u otro tipo de objeto documental De esta forma el contenido queda desvelado como los datos de una base de datos accesibles por web o las etiquetas inmersas en el documento normalmente en XHTML o directamente en XML y las instrucciones de visualizacion definidas en una hoja de estilos aparte Esas etiquetas permiten que los gestores de contenidos interpreten los documentos y realicen procesos inteligentes de captura y tratamiento de informacion 17 Segun Codina y Rovira 2006 en el proyecto de la Web Semantica conviven 2 grandes visiones por lo que se proponen 2 definiciones 1 La vision de la inteligencia artificial la Web Semantica es un conjunto de iniciativas destinadas a promover una futura web cuyas paginas esten organizadas estructuradas y codificadas de tal manera que los ordenadores sean capaces de efectuar inferencias y razonar a partir de sus contenidos 2 La vision del procesamiento robusto la Web Semantica es un conjunto de iniciativas destinadas a convertir www en una gran base de datos capaz de soportar un procesamiento sistematico y consistente de la informacion Retos Editar Algunos de los retos de la Web Semantica incluyen amplitud vaguedad incertidumbre inconsistencia y engano Los sistemas de razonamiento automatizado tendran que lidiar con todos estos temas con la finalidad de cumplir con la promesa de la Web Semantica Inmensidad La World Wide Web contiene miles de millones de paginas La ontologia de la terminologia medica de SNOMED por si sola contiene 370 000 nombres de las clases y la tecnologia para eliminar todos los terminos semanticamente duplicados todavia no esta disponible Cualquier sistema de razonamiento automatizado tendra que enfrentar verdaderamente a enormes entradas Indistincion Estos son conceptos imprecisos como jovenes o altos Esto surge de la indeterminacion en las consultas de los usuarios de los conceptos representados por los proveedores de contenidos de emparejar terminos de consulta a los terminos de servicios y de tratar de combinar diferentes bases de conocimiento con la superposicion de conceptos pero sutilmente diferentes La logica difusa es la tecnica mas comun para hacer frente a la indistincion Incertidumbre Estos son conceptos precisos con los valores inciertos Por ejemplo un paciente puede presentar un conjunto de sintomas que corresponden a un numero distinto de diagnosticos diferentes cada uno con una probabilidad diferente Tecnicas de razonamiento probabilistico se emplean generalmente para hacer frente a la incertidumbre La inconsistencia Estas son contradicciones logicas que inevitablemente surgiran durante el desarrollo de grandes ontologias y cuando las ontologias se combinan a partir de fuentes separadas El razonamiento deductivo falla catastroficamente cuando se enfrentan a la incoherencia ya que nada se deduce de una contradiccion El razonamiento rebatible y razonamiento paraconsistente son tecnicas que pueden emplearse para hacer frente a la inconsistencia El Engano Es cuando el productor de la informacion es intencionalmente enganoso al consumidor de la informacion las tecnicas de criptografia se utilizan actualmente para mitigar esta amenaza Esta lista de retos es ilustrativa mas que exhaustiva y se centra en los desafios a la logica unificadora y las capas de prueba de la Web Semantica El World Wide Web Consortium W3C En el informe final del Grupo incubador para razonamiento de incertidumbre para la World Wide Web URW3 XG agrupa estos problemas bajo el mismo epigrafe de incertidumbre Muchas de las tecnicas mencionadas aqui requeriran extensiones de la Web Ontology Language OWL por ejemplo para anotar las probabilidades condicionales Actualmente esta es un area de investigacion activa 18 Barreras Editar El desarrollo y difusion masivos de la web semantica tiene algunas dificultades que no ha podido superar todavia una de ellas es tecnologica y la otra esta relacionada con la falta de interes de los propietarios de las paginas web Las tecnologias para expresar la informacion en el formato que requiere una web semantica existen hace anos Quizas la componente mas especializada sea OWL que existe como estandar del W3C desde 2004 El componente tecnologico que falta es el que permita convertir de forma automatica el abundante contenido de texto de las paginas web en marcas OWL La web semantica requiere que los creadores de las paginas web traduzcan a mano su contenido en marcas OWL para que pueda ser interpretado por agentes semanticos Pero esto es inviable debido al gran volumen que tiene la Web y su imparable crecimiento razon por la que hay que plantear procesos de anotacion por lo menos semi automaticos 19 Afortunadamente muchas paginas aunque no representen un porcentaje elevado de todas las paginas del mundo tienen informacion formateada en su base de datos y pueden realizar esta conversion de manera automatica Por ejemplo un sitio con miles de fichas de peliculas que incluyen datos como titulo director fecha de estreno tiene estos datos prolijamente ordenados y clasificados en una base de datos lo que les permite elaborar un traductor de ficha de pelicula a OWL que sirva para todas las fichas sin necesidad de tener que realizar la traduccion a mano para cada una La otra barrera que se opone pasivamente a la web semantica es el modelo de negocio de gran cantidad de paginas web que obtienen ingresos de la publicidad Estos ingresos son posibles unicamente si sus paginas son visitadas por una persona y se pierden si los datos quedan disponibles para que los interprete un proceso automatico El siguiente ejemplo arbitrario y parcial ilustra este concepto para un trabajo de investigacion para la escuela sobre la vida de un procer un sistema semantico realiza la investigacion y presenta en pantalla el resultado fecha de nacimiento y defuncion batallas en las que participo hechos destacados frases celebres y todo esto sin necesidad de acceder a ninguna pagina web especifica y por lo tanto sin consumir la publicidad de los sitios que pusieron a disposicion esa informacion La vision no debe encerrarse en estos terminos Es muy probable que de surgir una web semantica masiva el modelo de negocios se adapte Sin embargo mientras no haya indicios de que esto vaya a suceder de manera inevitable e inminente no es logico suponer que los sitios web basados en publicidad apoyen su desarrollo poniendo su informacion en el formato necesario Avances Editar Actualmente existen nichos piloto que han comenzado con la transformacion hacia la web semantica Sistemas de datos abiertos gubernamentales en varios paises se encuentran en formato RDF Datos Abiertos en la Biblioteca Nacional de Espana gt datos bne es Datos Abiertos en la Biblioteca Nacional de Francia gt data bnf fr Intranets de conocimiento de empresas multinacionales Incorporacion de metadatos en sistemas de comercio electronico Resultados semanticos en el motor de busquedas Google Datos Abiertos en la Biblioteca Virtual Miguel de Cervantes Las actividades de investigacion sobre las aplicaciones corporativas Editar El primer grupo de investigacion enfocado explicitamente en el corporativo de la Web Semantica ha sido el equipo de ACACIA en la INRIA Sophia Antipolis fundada en 2002 Los resultados de su trabajo son el RDF S del motor de busqueda basado Corese y la aplicacion de la tecnologia de web semantica en el ambito del E learning 20 Desde 2008 el grupo corporativo de investigacion de la Web Semantica que se encuentra en la Universidad Libre de Berlin se centra en bloques de construccion Busqueda semantica Corporativa Colaboracion empresarial Semantica y la Ingenieria Ontologica corporativa 21 La investigacion en ingenieria ontologia incluye la cuestion de como involucrar a los usuarios no expertos en la creacion de ontologias y contenido semanticamente anotada para la extraccion de conocimiento explicito de la interaccion de los usuarios dentro de las empresas 22 Normas EditarLa normalizacion para la Web Semantica en el contexto de la Web 3 0 esta bajo el cuidado del W3C Componentes de la Web Semantica Editar Arquitectura tecnologica de la Web Semantica Los principales componentes de la Web Semantica son los metalenguajes y los estandares de representacion XML XML Schema RDF RDF Schema y OWL asi como el lenguaje SPARQL para la consulta de datos RDF 23 La OWL Web Ontology Language Overview describe la funcion y relacion de cada uno de estos componentes de la Web Semantica XML aporta la sintaxis superficial para los documentos estructurados pero sin dotarles de ninguna restriccion sobre el significado XML Schema es un lenguaje para definir la estructura de los documentos XML RDF es un modelo de datos para los recursos y las relaciones que se puedan establecer entre ellos Aporta una semantica basica para este modelo de datos que puede representarse mediante XML RDF Schema es un vocabulario para describir las propiedades y las clases de los recursos RDF con una semantica para establecer jerarquias de generalizacion entre dichas propiedades y clases OWL es un lenguaje para definir ontologias mediante la descripcion detallada de propiedades y clases tales como relaciones entre clases p ej disyuncion cardinalidad por ejemplo unicamente uno igualdad tipologias de propiedades mas complejas caracterizacion de propiedades por ejemplo simetria o clases enumeradas SPARQL es un lenguaje de consulta de conjuntos de datos RDF Ademas en dicha especificacion tambien se incluye un formato XML que detalla el modo en el que se estructuran los resultados obtenidos La usabilidad y aprovechamiento de la Web y sus recursos interconectados puede aumentar con la web semantica gracias a Los documentos etiquetados con informacion semantica comparese esta con la etiqueta lt meta gt de HTML usada para facilitar el trabajo de los robots Se pretende que esta informacion sea interpretada por el ordenador con una capacidad comparable a la del lector humano El etiquetado puede incluir metadatos descriptivos de otros aspectos documentales o protocolarios Vocabularios comunes de metadatos Ontologia Informatica y mapas entre vocabularios que permitan a quienes elaboran los documentos disponer de nociones claras sobre como deben etiquetarlos para que los agentes automaticos puedan usar la informacion contenida en los metadatos p ej el metadato author tenga el significado de autor de la pagina y no el del autor del objeto descrito en la pagina Agentes automaticos que realicen tareas para los usuarios de estos metadatos de la Web Semantica Servicios Web a menudo con agentes propios que provean de informacion a los agentes por ejemplo un servicio de garantias a quien un agente pudiera consultar sobre si un comercio electronico tiene un historial de mal servicio o de generar correo basura Los proveedores primarios de esta tecnologia son las URIs que identifican los recursos junto con XML y los namespaces Si a esto se anade un poco de logica mediante una RDF u otras tecnologias como los mapas tematicos y algo de razonamiento basado en tecnicas de inteligencia artificial Internet podria estar cerca de alcanzar las aspiraciones iniciales de su inventor Tim Berners Lee Estado actual de la normalizacion Editar Normas bien establecidas RDFRDFS Rule Interchange Format RIF SPARQL Unicode Uniform Resource Identifier Web Ontology Language OWL XMLTodavia no se ha realizado plenamente La unificacion de la logica y las capas de prueba Semantic Web Rule Language SWRL Aplicaciones EditarLa intencion es mejorar la usabilidad y utilidad de la Web y sus recursos interconectados mediante la creacion de servicios Web Semanticos tales como Los servidores que exponen a los sistemas de datos existentes utilizando los estandares RDF y SPARQL Muchos convertidores a RDF existen desde diferentes aplicaciones Las bases de datos relacionales son una fuente importante El servidor web semantico se conecta al sistema existente sin afectar a su funcionamiento Documentos marcados con informacion semantica una extension del HTML lt meta gt etiquetas utilizadas en las paginas web de hoy en dia para suministrar informacion para los motores de busqueda utilizando los rastreadores web Esta informacion podria ser legible por maquina sobre el contenido humano comprensible del documento como el creador titulo descripcion etc o puede ser puramente metadatos que representen una serie de factores tales como los recursos y servicios en otros lugares en el sitio Se debe de tener en cuenta que cualquier cosa que pueda ser identificado con un identificador uniforme de recursos URI puede ser descrito por lo que la web semantica puede razonar acerca de los animales personas lugares ideas etc Hay cuatro formatos de anotacion semantica que se pueden utilizar en los documentos HTML microformato RDFa de microdatos y JSON LD 24 El marcado semantico se genera regularmente de manera automatica en lugar de forma manual Vocabularios de metadatos comun ontologias y mapas entre vocabularios que permiten que los creadores de documentos sepan como marcar sus documentos para que los agentes puedan utilizar la informacion de los metadatos suministrados de este modo un autor en el sentido de que el autor de la pagina no se confundira con autor en el sentido de un libro que es objeto de una resena Agentes automatizados para realizar tareas para los usuarios de la Web Semantica que utilizan estos datos Servicios basados en la web a menudo con agentes propios para suministrar informacion especifica a los agentes por ejemplo un servicio de confianza que un agente podria preguntar si alguna tienda en linea tiene una historia de un mal servicio o envio de correo spam Estos servicios podrian ser utiles para los motores de busqueda publicos o que pueden ser utilizados para la gestion del conocimiento dentro de una organizacion Las aplicaciones de negocios incluyen Facilitar la integracion de la informacion procedente de fuentes mixtas Ambiguedades de disolucion en la terminologia corporativa El mejoramiento de la recuperacion de informacion lo que reduce la sobrecarga de informacion La identificacion de informacion relevante con respecto a un determinado dominio 25 Proporcionar apoyo de toma de decisionesEn una corporacion no es un grupo cerrado de usuarios y la gestion es capaz de cumplir los lineamientos de la empresa como la adopcion de determinadas ontologias y el uso de la anotacion semantica En comparacion con la Web Semantica publica hay menos requisitos de escalabilidad y la informacion que circula dentro de una empresa pueden ser generalmente mas confiable la privacidad es un problema menor fuera del manejo de datos de los clientes La censura y la privacidad EditarEl entusiasmo sobre la web semantica podria ser atemperada por preocupaciones con respecto a la censura y la privacidad por ejemplo las tecnicas de analisis de un texto pueden ahora ser facilmente sobrepasadas mediante el uso de otras palabras metaforas por ejemplo o mediante el uso de imagenes en lugar de palabras Una implementacion avanzada de la Web Semantica haria mas facil para los gobiernos controlar la visualizacion y creacion de informacion en linea ya que esta informacion seria mucho mas facil de entender para una maquina automatizada de bloqueo de contenidos Ademas la cuestion se ha planteado tambien que con el uso de FOAF archivos y geolocalizacion de metadatos habria muy poco anonimato asociado en la autoria de articulos por ejemplo un blog personal Algunos de estos problemas fueron abordados en el proyecto Politica Consciente Web 26 y es un tema activo de investigacion y desarrollo Web Semantica y Web 3 0 EditarErroneamente se identifican los conceptos de Web semantica y Web 3 0 La Web Semantica es un conjunto de actividades tal y como indica el propio World Wide Web Consortium 27 al amparo de las cuales se han desarrollado un conjunto de tecnologias que se aplican en muchos ambitos redes sociales publicacion de datos realizacion de inferencias marcado semantico de documentos convencionales etc Por su parte la Web 3 0 se refiere a un entorno en el que aplicaciones y agentes de usuario 28 intercambian datos los procesan e incluso realizan procesos de inferencias para generar nueva informacion 29 Vease tambien EditarW3C Mapas tematicos Datos enlazados Dublin Core WordNet RDF Ontologia Informatica DAML OIL FOAF DOAP SIOC DOAC OWL CubicWeb Cyc Representacion del conocimiento mediante redes semanticas Logica de descripcion Redifusion web RSS y Atom Echo Programacion logica funcional y declarativa Inteligencia Artificial Nueva Economia WYSIWYM Web 2 0 Web 3 0Bibliografia EditarCodina L Marcos M C Pedraza R coords 2006 Web semantica y sistemas de informacion documental Gijon TREA ISBN 9788497044608Referencias Editar The Semantic Web is a web of data There is lots of data we all use every day and it is not part of the web I can see my bank statements on the web and my photographs and I can see my appointments in a calendar But can I see my photos in a calendar to see what I was doing when I took them Can I see bank statement lines in a calendar Why not Because we don t have a web of data Because data is controlled by applications and each application keeps it to itself The Semantic Web is about two things It is about common formats for integration and combination of data drawn from diverse sources where on the original Web mainly concentrated on the interchange of documents It is also about language for recording how the data relates to real world objects That allows a person or a machine to start off in one database and then move through an unending set of databases which are connected not by wires but by being about the same thing W3C Semantic Web Activity Andy Carvin Tim Berners Lee Weaving a Semantic Web Digital divide network articulos 2005 Vianello Osti Marina 2004 El hipertexto entre la utopia y la aplicacion identidad problematica y tendencias de la Web Gijon TREA p 360 Bush Vannevar 1945 As We May Think En The Atlantic Montly 176 1 Recuperado el 7 de mayo de 2016 de http www theatlantic com magazine archive 1945 07 as we may think 303881 Nelson Theodor Literary Machines Sausalito CA Mindful Press Recuperado el 30 de abril de 2016 de http u tx net ccritics literary machines html Lamarca Lapuente Maria Jesus 2013 Hipertexto el nuevo concepto de documento en la cultura de la imagen Madrid Universidad Complutense de Madrid Tesis de doctorado en Ciencias de la Informacion Recuperado el 6 de mayo de 2016 de http www hipertexto info a b Berners Lee Tim 2000 Tejiendo la Red el inventor del World Wide Web nos descubre su origen Madrid siglo XXI de Espana editores p 254 Vallez Mari Rovira Cristofol Codina Lluis Pedraza Rafael 2010 Procedimientos para la extraccion de palabras clave de paginas web basados en criterios de posicionamiento en buscadores En Anuario Hypertext net n 8 Recuperado el 7 de mayo de 2016 de http www upf edu hipertextnet numero 8 extraccion keywords html Chavez E Maria Cardenas Oscar amp Benito Oscar 2014 La Web Semantica En Revista De Investigacion de Sistemas E Informatica 2 3 pp 43 54 Recuperado el 6 de mayo de 2016 de http revistasinvestigacion unmsm edu pe index php sistem article view 3477 Ontologias 2001 http www ontology org Gruber Tom R 1993 Toward Principles for the Design of Ontologies Used for Knowledge Sharing En Technical Report KSL 93 04 California Knowledge Systems Laboratory Stanford University Recuperado el 30 de abril de 2016 de http citeseerx ist psu edu viewdoc download doi 10 1 1 91 6025 amp rep rep1 amp type pdf a b Salazar Argonza Javier 2011 Estado actual de la Web 3 0 o Web Semanticas En Revista Digital Universitaria 12 11 Recuperado el 7 de mayo de 2016 de http www revista unam mx vol 12 num11 art108 index html ISSN 1607 6079 Kuster Boluda Ines Hernandez Fernandez Asuncion 2013 De la Web 2 0 a la Web 3 0 antecedentes y consecuencias de la actitud e intencion de uso de las redes sociales en la web semantica En Universia Business Review nº 37 pp 104 119 Recuperado el 7 de mayo de 2016 de http www redalyc org articulo oa id 43325648006 Victoria Shannon 2006 A more revolutionary Web En The New York Time Recuperado el 8 de mayo de 2016 de http www nytimes com 2006 05 23 technology 23iht web html r 0 World Wide Web Consortium W3C 2013 Semantic Web Recuperado el 8 de mayo de 2016 de http www w3 org standards semanticweb Alvarez Martin El W3C y la web semantica 2012 En VII Feria de Tiendas Virtuales Huesca 17 de Abril Recuperado el 10 de mayo de 2016 de http www w3c es Presentaciones 2012 0417 WebSemantica MA 0417 WebSemantica MA pdf Reig Dolors Llega con fuerza la Web Contextual Editado el 25 de Diciembre 2008 Acceso 27 de febrero de 2011 Lukasiewicz Thomas Umberto Straccia 2008 Managing uncertainty and vagueness in description logics for the Semantic Web En Semantic Web Challenge 6 4 pp 291 308 Luis Criado Fernandez Nosotros los constructores de la Web Semantica Copia de archivo en Wayback Machine Junio 2013 ISBN 978 84 616 0515 6 Buffa Michel Dehors Sylvain Faron Zucker Catherine Sander Peter 2005 Towards a Corporate Semantic Web Approach in Designing Learning Systems Review of the Trial Solutioins Project En International Workshop on Applications of Semantic Web Technologies for E Learning Amsterdam Holland pp 73 76 Paschke Adrian Corporate Semantic Web Freie Universitat Berlin Recuperado el 7 de mayo de 2016 de http www corporate semantic web de Hinze Annika Heese Ralf Luczak Rosch Markus Paschke Adrian 2012 Semantic Enrichment by Non experts Usability of Manual Annotation Tools En ISWC 12 Proceedings of the 11th international conference on The Semantic Web Boston USA pp 165 181 Juan Antonio Pastor Sanchez Tecnologias de la Web Semantica Barcelona Editorial UOC 2011 ISBN 978 84 9788 474 7 Sikos Leslie F 2015 Mastering Structured Data on the Semantic Web From HTML5 Microdata to Linked Open Data En Apress p 256 Recuperado el 11 de mayo de 2016 de http www apress com 9781484210505 ISBN 1484210492 Kuriakose John 2009 Understanding and Adopting Semantic Web Technology En Cutter IT Journal CUTTER INFORMATION CORP 22 9 pp 10 18 Hendler Jim 2003 Policy Aware Web Project En Maryland information and network dynamics lab semantic web agents Project Recuperado el 7 de mayo de 2016 de http www cs rpi edu hendler presentations PolicyAware pdf http www w3 org 2001 sw Lasilla Ora Hendler James 2007 Embracing Web 3 0 IEEE Computer Society Conrad Wolfram on Communicating with apps in web 3 0 IT PRO 17 Mar 2010 Enlaces externos EditarPablo Castells 2003 La web semantica Universidad Autonoma de Madrid Carolina Garcia Catano y David Arroyo Menendez 2002 Biblioteca Digital y Web Semantica Procedimiento semi automatico para transformar la web en web semantica Tesis doctoral Luis Criado Fernandez 1 2009 UNED The Semantic Web An Introduction en ingles Presentacion Construyendo la web semantica Entidades SEO El SEO semantico por Juan Jose Fdez Juan Etiquetas semanticas HTML5 Estructura de una pagina web y etiquetas semanticas tabla Datos Q54837 Multimedia Semantic Web Obtenido de https es wikipedia org w index php title Web semantica amp oldid 140523149, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos