martes, 20 de septiembre de 2011

MODELOS DE RECUPERACION DE INFORMACION

"Según la mayoría de estudios  realizando en los últimos años la recuperacion y organizacion de la informacion es uno de los aspectos que han cobrado  mayor relevancia. En la actualidad estos estudios resaltan la vital importancia que ha cobrado este campo. Esto se debe en gran medida a que los buscadores de internet están situados como el primer método utilizado para obtener cualquier tipo de información sea para el uso que sea (académico, lúdico, empresarial).
Debido a esto es de vital importancia conocer cuales son los métodos o modelos de recuperacion utilizados por los grandes buscadores (booleano, probabilístico, vectorial). En los últimos años y debido a los intereses económicos derivados de buenos posicionamientos en los distintos buscadores se está produciendo un boom en todos los campos relacionados con este tema, por tanto es necesario conocer como se estructuran los modelos de recuperación.

La principal clasificación para los modelos de recuperacion de informacion es la siguiente:
  • Modelos clásicos: Entre los que se encuentran los modelos probabilístico, booleano y vectorial.
  • Modelos estructurales: Entre los que destacan listas no sobrepuestas y el método de los nodos proximales.

CLASIFICACIÓN DE LOS MODELOS DE RECUPERACION.

Para facilitar el seguimiento de los contenidos, esta sección esta estructurada en las siguientes subsecciones:
  • Modelo Booleano:

  • Es un modelo de recuperación simple, basado en la teoría de conjuntos y el álgebra booleana. Dada su inherente simplicidad y su pulcro formalismo ha recibido gran atención y sido  adoptado por muchos de los primeros sistemas bibliográficos comerciales. Su estrategia de recuperación está basada en un criterio de decisión binario (pertinente o no pertinente) sin ninguna noción de escala de medida, sin noción de un emparejamiento parcial en las condiciones de la pregunta.

    Modelo Vectorial:

  • El modelo de recuperación vectorial o de espacio vectorial propone un marco en el que es posible el emparejamiento parcial, asignando pesos no binarios a los términos índice de las preguntas y de los documentos. Estos pesos de los términos se usan para computar el grado de similitud entre cada documento guardado en el sistema y la pregunta del usuario.

    Modelo Probabilistico:

  • El modelo de recuperación probabilistico se basa en la equiparación probabilística, dados un documento y una pregunta, es posible calcular la probabilidad de que ese documento sea relevante para esa pregunta".
Tomado:http://modelosrecuperacion.tripod.com/

1 comentario: