Web sintáctica: Busca información sin interpretación del significado. Es decir, si se escribe en Google, por ejemplo, la frase “la buena música” se buscará en que páginas aparecen esas tres palabras. La búsqueda se hace sin tener en cuenta el significado que tenga la frase.
Web semántica: “El término semántica se refiere a los aspectos del significado, sentido o interpretación del significado de un determinado elemento, símbolo, palabra, expresión o representación formal.”
La web sintáctica, donde se encuentran actualmente la mayoría de las webs, consiste en un conjunto de recursos enlazados entre sí.
En la web actual, las páginas se asemejas a un grafo formado por nodos, y arcos que representan hiperenlaces indiferenciados. Se puede decir, por ejemplo, que no se hace distinción entre la página personal de un pintor y el portal de una galería de arte online. Si un usuario quiere buscar información referente a “artículos sobre García Márquez” seguramente un buscador arroje miles de resultados de “artículos de García Márquez” pero tendrá que ir entrando y navegando en estos resultados para encontrar alguno que trate sobre el escritor y no que esté escrito por él.
Esta web, la sintáctica, los recursos, documentos digitales en lenguaje digital, son traducidos por el software para que el lenguaje de programación sea legible por las personas, así traducen un texto, por ejemplo, html, en una página web.
En el caso de la Web Semántica intenta superar estas limitaciones y en ella se dispone los datos de forma definida y enlazados, así la máquina puede visualizar los documentos de una forma clasificada, dotada de estructura y con unos recursos semánticos procesables por las maquinas, frente a la caótica organización que tiene la web actual.
En la web semántica se pretende mantener los principios que han dado éxito a la web actual. En su estructura cada nodo (recurso) tiene un tipo explicito, y los arcos representan relaciones explícitamente diferenciadas (ej. pintor-escuela, pintor-cuadro, escuela-lugar, etc.)
Así el software será capaz de diferenciar, por ejemplo, una página web de una escuela de pintura donde trabaja un pintor, de la página personal del pintor de la página de una galería donde expone un pintor.
La web semántica se basa en la ontología que es la jerarquía de conceptos con atributos y relaciones para intentar conseguir la adopción de ontologías comunes para todos (diseñadores web, buscadores, indexadores, usuarios, etc.) que puedan trabajar de una forma más sencilla y rápida.
De la evolución de la historia de la web se pueden destacar los siguientes acontecimientos:
- 1989: Tim Berners Lee presenta su proyecto WWW en el CERN (Conseil Européen pour la Recherche Nucléaire, es decir, Consejo Europeo para la Investigación Nuclear). Entonces no se bautizó oficialmente con el término, utilizándose para tal efecto el término mesh.
- 1991: Berners-Lee con ayuda de Robert Cailliau desarrollan y publican una propuesta más formal para la world wide web.
- 1993: CERN anunció que la web sería gratuita para todos, sin ningún tipo de honorarios. Creación de los primeros servidores Web y el navegador Mosaic.
- 1994: Creación del Consorcio Web (World Wide Web Consortium o W3C).
- 1997: Creación de SHOE (Simple HTML Ontology Extensions ), primer antecedente de la web semántica, basado en HTML, cuyo
- 1999: Primeros proyectos de la UE en web semántica. Y primer borrador de RDF (Marco de Descripción de Recursos para la web semántica) por parte de W3C.
- 2001: Primer congreso internacional de web Semántica (ISWC)
- 2003: OWL y OWL-S son recomendadas por W3C.
- 2004: Primer congreso europeo de web Semántica (ESWC)
- 2006: en la 5ª Conferencia Internacional de Web Semántica, en pleno auge de Facebook y otras redes sociales, se trata del tema de unificar ideas de “web semántica” y “web social”.
Capas de la Web Semántica
En definitiva, la web semántica es una web capaz de describir las cosas de manera que los ordenadores pueden entenderlos, describiendo las cosas de manera que las aplicaciones de los ordenadores pueden entender las relaciones. La web Semántica no se trata de enlaces entre páginas web sino de las descripciones de las relaciones entre las partes y las propiedades de las mismas.
Para conseguir estas relaciones se estructura en capas:
- UNICODE: Es el alfabeto, se trata de crear un repertorio de todos los caracteres en todos los lenguajes asignando un código único a cada uno de esos caracteres, así se podrá expresar la Web Semántica en cualquier idioma.
- URI: Cadena de caracteres que identifica inequívocamente un recurso (servicio, pagina, documento, dirección de email, etc.). Es el acrónimo de “Uniform Resource Identifier”. Se trata de la unión entre URL (descripción de la ubicación) y la URN (descripción del nombre en un espacio).
- XML: Es un metalenguaje con un conjunto infinito de etiquetas desarrollado por W3C, pero no es un lenguaje particular sino una manera de definir lenguajes. Algunos de estos lenguajes son XHTML, SVG y MathML. Esto posibilita crear nuevos vocabularios de manera estandarizada.
- RDF: Es un estándar W3C para describir recursos que se basa en la capa anterior y está diseñado para ofrecer un formato común para describir la información y así para que pueda ser leída y entendida por aplicaciones informáticas. El RDF es un lenguaje simple mediante el cual definimos las sentencias.
- Ontología. Ofrece un criterio para catalogar y clasificar la información. El uso de ontologías permite describir objetos y sus relaciones con otros objetos. Todo en el intento de formular un exhaustivo esquema conceptual dentro de un dominio para facilitar la comunicación y la compartición de información entre diferentes sistemas.
- Lógica: Además de ontologías, es decir, descripción de relaciones, se precisan también reglas de inferencia para que el ordenador entienda estas relaciones y las interprete de modo eficiente.
- Pruebas. Reglas que hacen posible las inferencias lógicas especificadas en la ontología.
- Confianza. En las fuentes de información.
- Firma digital: Bloque encriptado de datos que serán utilizados por los ordenadores y los agentes para verificar que la información adjunta ha sido ofrecida por una fuente específica confiable.
La semántica está presente en los tres pilares fundamentales del SEO:
- Autoridad: Para hacer link-builing tienes que saber cómo los buscadores interpretan el linking y anchoring en sus algoritmos, esto va mucho más allá de hacer una simple emisión y recepción de links, sino que se debe tener en cuenta los conceptos semánticos que usan los buscadores para rankea. La relevancia a día de hoy tiene más peso que la autoridad, es decir, es más importante que los links que apuntan a tu web como los que salen de ella, versen sobre el mismo tema que la web que se quiere posicionar, antes que lo que hagan es apuntar a webs de gran autoridad, pero sin relación.
- Contenido: Se debe de dejar la obsesión por las palabras clave y ofrecer un contenido de calidad para posicionarnos mejor. Para escribir un contenido optimizado no sirve con poner la keyword en los más que conocidos lugares y repetirla porque a día de hoy eso ya no funciona tan bien (y cada vez lo hará menos). Los buscadores se están centrando en las entidades y sus relaciones más que en la propia keyword. Es decir, que se puede hacer un artículo mucho más relevante para el buscador hacia un topic sin necesidad de repetir la misma palabra.
Google ha dejado de leer como un indio y ahora valora el contexto del contenido y ya no premia tanto las etiquetas y las palabras clave, que siguen siendo importantes, pero empiezan a dejar de ser fundamentales, para el posicionamiento orgánico (no confundir con los anuncios en motores de búsqueda, para los que las palabras clave son básicos).
Hay que tratar conseguir un texto orientado 100% a las personas y 100% entendible por los buscadores. ¿Esto quiere decir que ya no debo fijarme en las palabras clave? No, debo seguir buscando las palabras clave y usándolas, pero hacerlo siempre de forma natural, con buen contenido.
- Arquitectura: A nivel técnico hay que entender cómo los buscadores crawlean una web para optimizar cómo interpreta la estructura de la misma entre muchas otras cosas. Saber por ejemplo ¿cómo hace Google la lectura para detectar distintas regiones de un documento? ¿Cómo lo hace Bing? ¿O Yahoo? ¿O cómo extrae Google las taxonomías para entender la arquitectura? Se obtendrán una estructura mucho más relevante.