Para entender mejor el concepto de semántica, lo primero que tenemos que conocer es que existen diferentes niveles. La figura 1 ilustra los elementos de lo que se ha denominado el espectro semántico.

Figura 1. El espectro semántico
Metadatos
El primer nivel dentro del espectro semántico son los metadatos, que son datos acerca de los datos. Quienes han desarrollado páginas web, recuerdan que en HTML existe la etiqueta “meta”, que permite proveer información sobre el documento, tal como quién es el autor de la página, la tecnología con la que se desarrolló, las palabras claves. Estos valores fueron utilizados por los primeros buscadores para separar información por temas, o por autor, o por palabras claves. Esta información permitiría hacer búsquedas más inteligentes. Sin embargo, los meta tags de HTML no tuvieron el éxito deseado, debido a que las personas que desarrollaban estas páginas no entendían la importancia de este tipo de información. Los meta tags han sido prácticamente abandonados, pero existen iniciativas nuevas, como el estándar Dublín Core, que prometen dar una mejor solución a este problema.
Taxonomía
El siguiente nivel de semántica es la taxonomía, que es una jerarquización de la información. Este concepto se utiliza en las ciencias biológicas para clasificar a los seres vivos, pero también puede ser utilizado para clasificar información de cualquier índole. De hecho, lo hemos utilizado de una forma natural en muchas aplicaciones. Un ejemplo de esto es un sistema de archivos basado en directorios y subdirectorios.
Cabe mencionar que cada nivel de semántica contiene al anterior. Así, el concepto de taxonomía puede ser usado en conjunción con el de metadatos. Entonces, un sistema de directorios incluirá dentro de su definición, un conjunto de metadatos, como lo son los permisos, fecha de creación, propietario, entre otros.
La figura 2 muestra un ejemplo sencillo de clasificación, en donde tenemos un continente, y una sub-clasificación es México, que a su vez esta sub-clasificado por estados.

Figura 2. Ejemplo de una taxonomía
Tesauro
El siguiente nivel semántico es el tesauro, que es una extensión de las taxonomías para agregar elementos como sinónimos, homónimos, abreviaciones y antónimos. La figura 3 muestra como podríamos extender con tesauros al ejemplo expuesto anteriormente.
Figura 3. Ejemplo del uso de tesauros
Vemos entonces que el elemento Distrito Federal es equivalente a D.F. y DF, así que ahora sabemos que podemos encontrarlo en cualquiera de esas formas y se refiere a lo mismo.
Modelo conceptual
El siguiente elemento semántico es el modelo conceptual. Este provee un mapa de información en base a una topología de red multirelación. Las dos notaciones más usadas para esto son Topic Maps, y RDF (Resource Description Framework).
Formalmente, el modelo conceptual es una representación de un dominio, o área de conocimiento en el que se identifican:
• Sus principales entidades o conceptos.
• Las relaciones entre estas entidades.
• Los atributos de las entidades de información y las relaciones existentes entre las mismas.
La figura 4 muestra un ejemplo de un modelo conceptual.

Figura 4. Un mapa de tópicos representando un modelo coneptual
El último nivel del espectro semántico son las ontologías. Las ontologías representan información adicional sobre los conceptos de un dominio, y específicamente de las relaciones que hay entre ellos. Se utilizan para deducir nuevas relaciones de información en base a un modelo conceptual existente. Así, por ejemplo, si tenemos relaciones de información en donde A conduce a B, y B conduce a C, se puede generar una nueva relación donde A conduce a C.
Conclusión
Aunque todavía no se ha logrado implementar el concepto de Web Semántica en su concepción ideal, es cierto que se están haciendo esfuerzos importantes por implementar dichos conceptos para la creación de aplicaciones que permitan procesar la información de la misma forma que un humano.
INFOTEC se ha dedicado en los últimos años a hacer investigación y desarrollo en materia de utilización del concepto de redes semánticas. Como parte de este esfuerzo, hemos construido la herramienta INFOTEC WebBuilder Open Source, la cual implementa estos conceptos semánticos para estructurar la información que se genera en un sitio Web, permitiendo al cibernauta llegar facilmente a la información deseada.
Referencias
• Michael C. Daconta, et al. “The Semantic Web”. Wiley, 2003.
Acerca del autor
Víctor Hugo Lorenzana González es consultor en INFOTEC, un centro público para la investigación y desarrollo perteneciente al CONACYT. Ha dedicado los últimos cinco años a la investigación y aplicación de conceptos semánticos aplicados a portales de colaboración y conocimiento. Víctor es Ingeniero en Computación de la Facultad de Ingeniería de la UNAM.
- Log in to post comments