Glosario (sp)‎ > ‎

Tesauro || Thesaurus

Artículo

 Editor
Sonia Sánchez-Cuadrado sonia.sanchez.cuadrado@uc3m.es
 Contribuciones incorporadas
Eva Carbonero, Jorge Morato (20/07/2009)
 Ámbito de uso
Recuperación de Información, organización de la información
 Tipo
Concepto, recurso
 Francés
thésaurus
 Alemán Thesaurus

Contenidos

1) Componentes del Tesauro
2) Diferencia entre Ontologías y Tesauros
3) Metodología para su construcción
4) Ejemplos de tesauros funciona-les online
5) Software para la creación de tesauros
6) Características de los tesauros
7) Conclusiones.


Instrumento de control terminológico para la representación sistemática de un dominio particular del conocimiento de manera normalizada. Se trata de un lenguaje controlado formalmente organizado mediante relaciones explícitas entre conceptos. Los tesauros se han utilizado para la indización documental.

Los términos pueden ordenarse de manera alfabética, sistemática o gráfica.

Presenta notación: notas de alcance, relaciones jerárquicas, asociativas, de equivalencia, etc. 

Ejemplo de uso: 
AUTOMOVIL
TG Vehículo autopropulsado
TE ambulancia
TE taxi
TR conductor
UP coche
NA Término creado por J.M. en 2009
donde, TG representa término genérico, TE término específico, TR término relacionado, UP usado por, NA nota de alcance

Componentes del Tesauro

Los tesauros se componen de:
  • Descriptores: Términos normalizados que componen el tesauro.
  • No descriptores: Términos no aceptados que deben remitir a los descriptores (términos normalizados).
  • Relaciones jerárquicas: Término Genérico (TG)/ Término Específico (TE). Hace referencia a los términos conceptualmente superiores o inferiores al término de la entrada.En la bibliografía pueden encontrarse distintos tipos de relaciones jerárquicas: 
    • género/especie; 
    • todo/parte; 
    • relaciones de ejemplo; 
    • relaciones polijerárquicas;
  • Relaciones asociativas: Término Relacionado (TR). Hace referencia a los términos conceptualmente relacionados al término de la entrada.
  • Relaciones de Equivalencia: USE/Usado Por (UP). Esta notación remite del término no aceptado al término aceptado.
  • Notas de alcance: Nota de Alcance (NA). Esta nota aclaratoria delimita conceptualmente al término de la entrada.

Diferencia entre Ontologías y Tesauros

El debate tesauros vs. Ontologías está abierto. El tesauro tiene una estructura marcada y un tipo de relaciones determinadas, mientras que la ontología presenta más posibilidades, contemplando la polijerarquía que muchos tesauros no soportan.

Las diferencias no las convierten en herramientas distintas. Conceptualmente tienen la misma función, pero el tesauro tiene su origen en el mundo impreso y la ontología es inconcebible en papel.

La situación actual es la de trasladar el formato tradicional del tesauro a la web (RDF/XML), ofreciendo todas las ventajas de ésta, pero en muchos casos es insuficiente.

Para la publicación de ontologías en la www se emplea el lenguaje de marcado OWL (Ontology Web Language), construido sobre RDF y codificado en XML. Podríamos decir que son una versión más completa y que presentan más posibilidades que los tesauros; posiblemente dentro de unos años el debate termine y se considere a los tesauros simplemente como los predecesores de las ontologías.

Debe también distinguirse el tesauro de la taxonomía, en cuanto a que ésta es una mera estructura jerárquica para esquematizar conceptos de un área del conocimiento (®taxonomía).

Metodología para su construcción

  1. En primer lugar deben determinarse las necesidades del centro, determinar si es necesario crear un tesauro ex novo, adoptar uno preexistente, etc.
  2. Selección de términos.
  3. Seleccionar el software para la construcción del tesauro; se analizarán las herramientas existentes y se valorará la posibilidad de adquirir el software, emplear uno gratuito, etc.
  4. Construcción del tesauro propiamente dicha; mediante un comité de expertos, empleando el método deductivo (de los términos genéricos a los más específicos) o el método inductivo (de los términos específicos a los más genéricos).
  5. Formación de los usuarios que manejarán el tesauro.
  6. Mantenimiento del tesauro (actualización de los términos).

Ejemplos de tesauros funcionales online:

  • Canadian literacy thesaurus: vocabulario controlado bilingüe del área de literatura adulta. Tanto la terminología como la estructura del tesauro reflejan las diversas prácticas literarias regionales y las actividades alrededor de Canadá. El sistema de búsqueda es mediante listado alfabético o palabras clave. La última revisión que se realizó en este tesauro fue en 2007. Emplea el software Multites.
  • CAB Thesaurus: vocabulario controlado de más de 48000 términos de todas las ciencias de la vida. Enfocado al ámbito de las bibliotecas académicas, gubernamentales y corporativas, para navegar, indizar, buscar, catalogar, organización de las bases de datos y el manejo de la intranet. Permite indizar tanto información digital como textual, así como todo tipo de materiales y colecciones.

Software para la creación de tesauros:

  • ThManager es una herramienta para crear y visualizar vocabularios controlados: Tesauros, taxonomías y listas de clasificación. La descarga es gratuita. Entre sus características está: Multiplataforma (Windows, Unix y Java), Multilingüe, codificado con Dublin Core y SKOS, Extractor de términos relacionados mediante WordNet.
  • Multites: herramienta que permite crear y gestionar tesauros, taxonomías y otro tipo de vocabularios controlados. Se puede exportar a XML y HTML, aunque no permite hacer un tesauro muy elaborado.
  • Domain Reuse: herramienta que permite crear y gestionar tesauros; permite importar tesauros (realizados previamente) y exportarlos (mediante informes; el informe “alfabético” es el más completo, contiene toda la información). Software propietario, permite la descarga de una versión de prueba.
  • TemaTres: software libre para crear tesauros multilingües en línea con gran variedad de formatos de exportación.
  • TCS: Se trata de uno de los editores más completos y flexibles. Tiene una buena integración con el entorno Web.

Características de los tesauros

  • Monolingües o Plurilingües
  • Polijerárquicos o Monojerárquicos: La polijerarquía se da cuando un término puede tener más de un término genérico en el mismo tesauro. 
  • Los términos de indización no tienen que ser necesariamente unitérminos, podemos encontrar frases adjetivadas, frases preposicionales, siglas o acrónimos (si uso está extendido), etc.
  • Multidisciplinareidad: Los dominios o áreas de conocimiento pueden presentar solapamiento con otras áreas. La inclusión de estas áreas puede dar lugar a ambigüedad del término (p.e. polisemia), perjudicando al rendimiento del tesauro. . 
  • Visualización y Formalización: La propuesta de tesauro se hizó en una época en la que los ordenadores personales estaban poco desarrollados, por lo que las primeras propuestas definían salidas para imprimir en papel mediante la visualización jerárquica y alfabética. Con el desarrollo de la Web, y la necesidad de que diferentes sistemas informáticos pudieran tener acceso a estos recursos, se propuso la formalización en XML, frecuentemente bajo el modelado RDF/RDFS. También se ha propuesto un vocabulario para referirse a los distintos elementos del tesauro, denominado SKOS-Core, si bien existen otros vocabularios similares, como Zthes, BS8723, MADS o el PSI de tesauros para el estándar Topic Maps.

Conclusiones

No siempre es necesaria la construcción de un tesauro, puesto que existen otras herramientas que, dependiendo de las necesidades del centro, pueden resultar igualmente satisfactorias y requieren de una menor elaboración, es el caso de las taxonomías.

Un tesauro conlleva un elevado coste inicial que se amortiza a lo largo del tiempo con su uso, sin embargo es necesario destinar recursos a su mantenimiento, puesto que un tesauro no actualizado es un tesauro inservible.

Para obtener el máximo rendimiento de un tesauro, poder actualizarlo cómodamente e interrelacionarlo con otro/s tesautos, es conveniente editarlo o crearlo on-line (RDF/XML; SKOS-Core schema RDF).

Recursos Relacionados 
  • Canadian literacy thesaurus. Disponible en: http://www.thesaurusalpha.org/  (Consultado Julio 2009)
  • Cab thesaurus. Disponible en: http://www.cabi.org/ (Consultado Julio 2009)
  • Domain Reuse. Disponible en: http://www.reusecompany.com/validaProducto.aspx?id=13&demo=1 (Consultado Julio 2009)
  • Multites. Disponible en: http://www.multites.com/ (Consultado Julio 2009)
  • Thmanager.  Disponible en: http://thmanager.sourceforge.net/ (Consultado Julio 2009)
  • Thesaurus Alpha. Disponible en:  http://thesaurusalpha.org/ (Consultado Julio 2009)
  • TemaTres. Disponible en http://tematres.r020.com.ar/ (Consultado Abril 2010)
Referencias 
  • AICHINSON, J. and DEXTRE, S. (2004). The Thesaurus: A Historical Viewpoint with a Look to the Future. Cataloging & Classification Quarterly, vol. 37, nº 3/4, pp. 5-21.
  • LANCASTER, F. W. (1995) El control del vocabulario en la recuperación de la información. València : Universitat de València, , p. 286
  • SLYPE, G. van. (1991). Lenguajes de indización : concepción, construcción y utilización en los sistemas documentales. Fundación Germán Sánchez Ruipérez. P 200. 
  • PÉREZ AGÜERA, J.R. (2004). Automatización de tesauros y su utilización en la Web Semántica. BID: textos universitaris de biblioteconomía i documentació, Desembe 2004, nº 13. 
  • ISO-2788: 1986. Guidelines for theEstablishment and Development of Monolingual Thesauri. International Organization for Standardization, Second edition -11-15 UDC 025.48. Geneva: ISO, 1986.
  • SÁNCHEZ-CUADRADO, S., MORATO, J., [et. al.] (2007). Definición de una metodología para la construcción de Sistemas de Organización del Conocimiento a partir de un corpus documental en Lenguaje Natural. Procesamiento del Lenguaje Natural, nº 39, pp. 213-220. 
Entradas
Nueva entrada. Cuando se introduzca una nueva entrada copiar este párrafo y las siguientes líneas y pegarlas al final de la columna. A continuación, borrar el párrafo azul superior y sustituir los campos 'nombre', 'fecha' y 'texto'.
Nombre (fecha)
 
[Texto de Entrada]
 



Entradas incorporadas
Jorge Morato (20/07/2009)
 
[Corresponde con la primera versión del artículo, ahora recogido en la columna de la izquierda.]
 
 
Subpages (1): Thesaurus
Comments