jueves, 7 de abril de 2011

Novedades en recuperación de información

Visita nuestro sitio amigo para conocer mayor información sobre información digital, posicionamiento Web, Google Fight, ética en la recuperación de información digital, digitalización, entre otros...

http://sistemasderecuperaciondinfo.blogspot.com/

Hacemos parte de una comunidad que amplia el conocimiento sobre como obtener información en medio de la explosión de datos de Internet, haciendo de la red una oportunidad de crecimiento

domingo, 7 de noviembre de 2010

GLORARIO: TESAUROS


Tesauro: alfabético o sistemáticos ordenados por un  inventario temático entre el los cuales hay  relaciones semánticas,  paradigmáticas, de  jerarquía, son establecidas. La sinonimia, la homonimia y la polisemia son controladas en la medida de lo posible.

Término compuesto: Un término compuesto es un término que consiste en más que una palabra (un término de frase). Las palabras compuestas de más de una palabra son a menudo sustantivos.  

Palabra compuesta: es una combinación de dos o más. Ejemplos:
Kleuterschool (holandés, construido da partir de los dos hombres kleuter y escuela);

Vocabulario controlado: es un conjunto  limitado de términos o notaciones en un tesauro  que se utiliza tanto para la  indización como para la  búsqueda.  Un vocabulario controlado se emplea sinónimos en una lengua natural tomados de de sinónimos y homónimos para el uso de indización. En la mayoría de los casos la estructura es impuesta a los términos y las notaciones de modo que los  significados estén vinculados de alguna manera.

Descriptor: Un término que se utiliza constantemente en la indización para representar un concepto dado. Sinónimo: término preferido

Equivalencia de una lengua: Los términos de una lengua dada tienen términos en otras lenguas con el mismo, o  parte del mismo significado. Véase  también la equivalencia Exacta, la equivalencia Inexacta, la Operación de no equivalencia, Parcial la equivalencia y la equivalencia "a muchos de equivalencia”.

Término de préstamo: Un término en una lengua (idioma de origen) que ha  adoptado sin modificaciones  en una segunda lengua (el idioma de destino)

No descriptor: Un término en un tesauro que no se utiliza en la indización para presentar un  concepto dado,  actúa sólo como  punto de acceso que se refiere al descriptor que debe utilizar en su lugar. Sinónimo: término no preferido

No equivalencia: Para un determinado término de un idioma  no hay un término existente con un equivalente en otro idioma.

Tesauro asimétrico: Un tesauro multilingüe en el que el número de descriptores no es lo mismo en cada idioma, así como los descriptores de forma que se relacionan entre si y pueden ser de diferentes lenguas.  ´

Equivalencia uno a muchos: Para expresar el significado de un término en una  de las lenguas,  más que un término es necesitado en otro idioma.

Idioma de origen: La lenguaje  que sirve como punto de partida cuando un término se traduce en su término equivalente.

Sujeto: El contenido intelectual de un documento según lo  determinado en análisis temático y  destinados a traducir en los  descriptores.

Tesauro simétrico: Un tesauro multilingüe en el que cada  descriptor tiene un único descriptor  equivalente  a  la  lengua y es relacionado con otros descriptores en una determinado idioma.

Fuente:IFLA. “Guidelines for Multilingual Thesauri”, [En línea] (2010). [consultado 07 Nov. 2010]. Disponible en < http://archive.ifla.org/VII/s29/pubs/Draft-multilingualthesauri.pdf>

Morfología y semántica en tesauros


Alcance de descriptores

Cada uno de los descriptores que se utilicen en los tesauros representar un concepto, los descriptores se encuentran en  principio en  términos de una lengua natural, y ninguno  término artificial  lo cual deben  ser adoptados al  tesauro.

Todos los conceptos que son representados por los descriptores  se pueden agrupar  por categorías lo que es conocido  como las fesetas las cuales deben tener  características comunes por ejemplo sitios  geográficos, cronología, procesos

Existen clases que son únicas y deben ser expresados como nombre propio  una elección. Una elección  tiene que hacerse entre:

  • Elección del nombre propio en un idioma para ser utilizado en todos los idiomas.
  • La utilización del nombre propio en cada idioma que tiene el nombre, y el nombre propio en el idioma general para los idiomas que carecen de ello.
  • Utilización de traducciones en la medida razonable y posible.

Al determinar cuáles fueron las preferidos se deben anotar aquellos que no lo fueron, es de utilidad una lista actualizada de  para  cada lengua.             

Clasificación y  ambigüedad de descriptores

  • Cada descriptor es restringido con un único significado dentro del tesauro
  • El significado del descriptor puede es explicado en el contexto y la estructura
  • Cada uno de los descriptores debe tener el alcance previsto sin importar el idioma
  • La ambigüedad se debe evitar en la medida de lo posible. Un calificador  es a menudo suficiente para los fines  de desambiguación.

TESAUROS:ABREVIATURAS

LISTA DE ABREVIATURAS1
Es importante tener presente las abreviaturas  que son utilizadas en los tesauros  para poder entender de mejor forma la estructura que tiene el mismo.

Holandés
Inglés
Alemán
Francés
Significado
Uso
Uso
BS
EM
Usado para …
UF
UF
BF
EP
Se utiliza para
BT
BT
OB
TG
Término más amplio
NT
NT
UB
TS
Término específico
RT
RT
VB
TA
Término relacionado
SN
SN
D
NE
Nota de alcance


1.IFLA. “Guidelines for Multilingual Thesauri”, [En línea] (2010). [consultado 07 Nov. 2010]. Disponible en < http://archive.ifla.org/VII/s29/pubs/Draft-multilingualthesauri.pdf>

PROBLEMAS EN LA CREACION DE TESAUROS

Existen varios problemas en la creación de tesauros los dos principales son:

1-Problemas semánticos  

Hace referencia a la equivalencia  que tienen los términos  que se determinaron preferidos y no-preferidos en el idioma seleccionado para recuperar la información, debe existir equivalencia no solo en  el idioma sino en los lenguajes de la personas  

2-Los problemas estructurales

Se es de esperar que se encuentre una relación  jerárquica y asociativa entre todos los términos, hay que tener en cuenta que esta estructura dependerá del idioma de recuperación de información que se esté manejando por lo que no en todos aplicar la misma estructura a todos los idiomas.

DIRECTRICES PARA TESAUROS MULTILINGÜES

Un lenguaje de recuperación de información multilingües lo podemos  encontrar en  diferentes formas como los tesauros, listas de títulos, los tipos de clasificación enumerada o analítico-sintética, su característica principal como su palabra lo dice “multilingües” es tener tanto los términos como las relaciones en más de un idioma.

En 1970 con la elaboración de las directrices, dos hechos han tenido un rol significativo en el modo de pensar en cuanto al  acceso multilingüe a la información:

  1. La construcción no simétrica de tesauros  
  2. La interconexión de dos o más tesauros o vocabularios controlados
Hay  tres enfoques en el desarrollo de tesauros multilingües:

  1. La elaboración de un diccionario de sinónimos nuevos de abajo  hacia arriba
a-    Se debe comenzar con un lenguaje base y poco a poco se van agregando otras leguas o lengua.
b-    A partir de más de un idioma al mismo tiempo.

  1. La combinación de tesauros existentes
a-    La fusión de dos o más tesauros existentes en un nuevo (multilingüe) recuperación lingüística que se utilizará en la indización y recuperación.
b-    La vinculación existente de un encabezamiento de materia e idiomas del tesauro entre sí, utilizando los tesauros existentes y títulos de idiomas tanto en la indización y recuperación.

  1. La traducción de diccionario de sinónimos en uno o más idiomas  convirtiéndose el lenguaje del tesauro existente en el  idioma dominante.

sábado, 6 de noviembre de 2010

Buscadores para la recuperación de información: MDS Knowledge Tree

Knowledge Tree es un Sistema de Gestión Documental (Management Document System) que permite la administración de archivos mediante:

Uso compartido de archivos y colaboración[1]


Esta herramienta permite que los documentos se encuentren en un único repositorio de información, el cual puede ser tratado tanto por el administrador de la herramienta como por los usuarios dentro de uno o varios documentos a la vez con el “uso de versiones KnowledgeTree e historial de transacciones completo para realizar un seguimiento del ciclo de vida del documento”[2].

Seguridad en línea de acceso[3]


Adicional a esto, esta aplicación permite recuperar la información desde cualquier ubicación de acuerdo a permisos de acceso modificables y el manejo de copias de seguridad.

Búsqueda y vista previa[4]


Knowledge Tree además permite hacer búsquedas por nombre de archivo, propiedades y texto interno, con la posibilidad de acceder al documento mediante vista previa automática o de visualización en otras aplicaciones.

Gestión del Conocimiento y Sistemas de Recuperación de Información

La privacidad desde Google



Stefany Buitrago - Loraine Vigoya
Universidad de la Salle
Programa de Sistemas de Información y Documentación