Recuperación de información
Todo sobre Sistemas de Recuperación de Información - Universidad de La Salle - Programa de Sistemas de Información y Documentación
jueves, 26 de abril de 2012
jueves, 7 de abril de 2011
Novedades en recuperación de información
Visita nuestro sitio amigo para conocer mayor información sobre información digital, posicionamiento Web, Google Fight, ética en la recuperación de información digital, digitalización, entre otros...
http://sistemasderecuperaciondinfo.blogspot.com/
Hacemos parte de una comunidad que amplia el conocimiento sobre como obtener información en medio de la explosión de datos de Internet, haciendo de la red una oportunidad de crecimiento
http://sistemasderecuperaciondinfo.blogspot.com/
Hacemos parte de una comunidad que amplia el conocimiento sobre como obtener información en medio de la explosión de datos de Internet, haciendo de la red una oportunidad de crecimiento
domingo, 7 de noviembre de 2010
GLORARIO: TESAUROS
Tesauro: alfabético o sistemáticos ordenados por un inventario temático entre el los cuales hay relaciones semánticas, paradigmáticas, de jerarquía, son establecidas. La sinonimia, la homonimia y la polisemia son controladas en la medida de lo posible.
Término compuesto: Un término compuesto es un término que consiste en más que una palabra (un término de frase). Las palabras compuestas de más de una palabra son a menudo sustantivos.
Palabra compuesta: es una combinación de dos o más. Ejemplos:
Kleuterschool (holandés, construido da partir de los dos hombres kleuter y escuela);
Vocabulario controlado: es un conjunto limitado de términos o notaciones en un tesauro que se utiliza tanto para la indización como para la búsqueda. Un vocabulario controlado se emplea sinónimos en una lengua natural tomados de de sinónimos y homónimos para el uso de indización. En la mayoría de los casos la estructura es impuesta a los términos y las notaciones de modo que los significados estén vinculados de alguna manera.
Descriptor: Un término que se utiliza constantemente en la indización para representar un concepto dado. Sinónimo: término preferido
Equivalencia de una lengua: Los términos de una lengua dada tienen términos en otras lenguas con el mismo, o parte del mismo significado. Véase también la equivalencia Exacta, la equivalencia Inexacta, la Operación de no equivalencia, Parcial la equivalencia y la equivalencia "a muchos de equivalencia”.
Término de préstamo: Un término en una lengua (idioma de origen) que ha adoptado sin modificaciones en una segunda lengua (el idioma de destino)
No descriptor: Un término en un tesauro que no se utiliza en la indización para presentar un concepto dado, actúa sólo como punto de acceso que se refiere al descriptor que debe utilizar en su lugar. Sinónimo: término no preferido
No equivalencia: Para un determinado término de un idioma no hay un término existente con un equivalente en otro idioma.
Tesauro asimétrico: Un tesauro multilingüe en el que el número de descriptores no es lo mismo en cada idioma, así como los descriptores de forma que se relacionan entre si y pueden ser de diferentes lenguas. ´
Equivalencia uno a muchos: Para expresar el significado de un término en una de las lenguas, más que un término es necesitado en otro idioma.
Idioma de origen: La lenguaje que sirve como punto de partida cuando un término se traduce en su término equivalente.
Sujeto: El contenido intelectual de un documento según lo determinado en análisis temático y destinados a traducir en los descriptores.
Tesauro simétrico: Un tesauro multilingüe en el que cada descriptor tiene un único descriptor equivalente a la lengua y es relacionado con otros descriptores en una determinado idioma.
Fuente:IFLA. “Guidelines for Multilingual Thesauri”, [En línea] (2010). [consultado 07 Nov. 2010]. Disponible en < http://archive.ifla.org/VII/s29/pubs/Draft-multilingualthesauri.pdf>
Morfología y semántica en tesauros
Alcance de descriptores
Cada uno de los descriptores que se utilicen en los tesauros representar un concepto, los descriptores se encuentran en principio en términos de una lengua natural, y ninguno término artificial lo cual deben ser adoptados al tesauro.
Todos los conceptos que son representados por los descriptores se pueden agrupar por categorías lo que es conocido como las fesetas las cuales deben tener características comunes por ejemplo sitios geográficos, cronología, procesos
Existen clases que son únicas y deben ser expresados como nombre propio una elección. Una elección tiene que hacerse entre:
- Elección del nombre propio en un idioma para ser utilizado en todos los idiomas.
- La utilización del nombre propio en cada idioma que tiene el nombre, y el nombre propio en el idioma general para los idiomas que carecen de ello.
- Utilización de traducciones en la medida razonable y posible.
Al determinar cuáles fueron las preferidos se deben anotar aquellos que no lo fueron, es de utilidad una lista actualizada de para cada lengua.
Clasificación y ambigüedad de descriptores
- Cada descriptor es restringido con un único significado dentro del tesauro
- El significado del descriptor puede es explicado en el contexto y la estructura
- Cada uno de los descriptores debe tener el alcance previsto sin importar el idioma
- La ambigüedad se debe evitar en la medida de lo posible. Un calificador es a menudo suficiente para los fines de desambiguación.
TESAUROS:ABREVIATURAS
LISTA DE ABREVIATURAS1
Es importante tener presente las abreviaturas que son utilizadas en los tesauros para poder entender de mejor forma la estructura que tiene el mismo.
Holandés | Inglés | Alemán | Francés | Significado |
Uso | Uso | BS | EM | Usado para … |
UF | UF | BF | EP | Se utiliza para |
BT | BT | OB | TG | Término más amplio |
NT | NT | UB | TS | Término específico |
RT | RT | VB | TA | Término relacionado |
SN | SN | D | NE | Nota de alcance |
1.IFLA. “Guidelines for Multilingual Thesauri”, [En línea] (2010). [consultado 07 Nov. 2010]. Disponible en < http://archive.ifla.org/VII/s29/pubs/Draft-multilingualthesauri.pdf>
PROBLEMAS EN LA CREACION DE TESAUROS
Existen varios problemas en la creación de tesauros los dos principales son:
1-Problemas semánticos
Hace referencia a la equivalencia que tienen los términos que se determinaron preferidos y no-preferidos en el idioma seleccionado para recuperar la información, debe existir equivalencia no solo en el idioma sino en los lenguajes de la personas
2-Los problemas estructurales
Se es de esperar que se encuentre una relación jerárquica y asociativa entre todos los términos, hay que tener en cuenta que esta estructura dependerá del idioma de recuperación de información que se esté manejando por lo que no en todos aplicar la misma estructura a todos los idiomas.
DIRECTRICES PARA TESAUROS MULTILINGÜES
Un lenguaje de recuperación de información multilingües lo podemos encontrar en diferentes formas como los tesauros, listas de títulos, los tipos de clasificación enumerada o analítico-sintética, su característica principal como su palabra lo dice “multilingües” es tener tanto los términos como las relaciones en más de un idioma.
En 1970 con la elaboración de las directrices, dos hechos han tenido un rol significativo en el modo de pensar en cuanto al acceso multilingüe a la información:
- La construcción no simétrica de tesauros
- La interconexión de dos o más tesauros o vocabularios controlados
Hay tres enfoques en el desarrollo de tesauros multilingües:
- La elaboración de un diccionario de sinónimos nuevos de abajo hacia arriba
a- Se debe comenzar con un lenguaje base y poco a poco se van agregando otras leguas o lengua.
b- A partir de más de un idioma al mismo tiempo.
- La combinación de tesauros existentes
a- La fusión de dos o más tesauros existentes en un nuevo (multilingüe) recuperación lingüística que se utilizará en la indización y recuperación.
b- La vinculación existente de un encabezamiento de materia e idiomas del tesauro entre sí, utilizando los tesauros existentes y títulos de idiomas tanto en la indización y recuperación.
- La traducción de diccionario de sinónimos en uno o más idiomas convirtiéndose el lenguaje del tesauro existente en el idioma dominante.
sábado, 6 de noviembre de 2010
Buscadores para la recuperación de información: MDS Knowledge Tree
Knowledge Tree es un Sistema de Gestión Documental (Management Document System) que permite la administración de archivos mediante:
Uso compartido de archivos y colaboración[1]
Esta herramienta permite que los documentos se encuentren en un único repositorio de información, el cual puede ser tratado tanto por el administrador de la herramienta como por los usuarios dentro de uno o varios documentos a la vez con el “uso de versiones KnowledgeTree e historial de transacciones completo para realizar un seguimiento del ciclo de vida del documento”[2].
Seguridad en línea de acceso[3]
Adicional a esto, esta aplicación permite recuperar la información desde cualquier ubicación de acuerdo a permisos de acceso modificables y el manejo de copias de seguridad.
Búsqueda y vista previa[4]
Knowledge Tree además permite hacer búsquedas por nombre de archivo, propiedades y texto interno, con la posibilidad de acceder al documento mediante vista previa automática o de visualización en otras aplicaciones.
La privacidad desde Google
Stefany Buitrago - Loraine Vigoya
Universidad de la Salle
Programa de Sistemas de Información y Documentación
Suscribirse a:
Entradas (Atom)