lunes, 29 de agosto de 2011

ESTRUCTURA DE LOS DOCUMENTOS

DOCUMENTOS ESTRUCTURADOS

"Como la palabra lo indica "son aquellos que tienen una estructura y que además contienen etiquetas cuyo signi cado semántico va más allá del propio texto de la misma", es decir que cuentan con un orden que permite que el documento sea entendido por cualquier persona".

ADIEGO, Rodriguez Joaquin. "La estructura de los documentos en el ámbito de recuperación de información: propuestas para su compresión, indexación y recuperación. 2004. p6. disponible en http://www.infor.uva.es/~jadiego/files/tesis.pdf

DOCUMENTO SEMIESTRUCTURADO

"Son aquellos documentos que contienen datos que carecen de rigidez, esquema regular, o cambios constantes en el esquema.

Los datos semiestructurados pueden ser irregulares o incompletos y tienen una estructura que puede cambiar rápido o impredeciblemente"

Tomado de http://recuperaciondinformacion.blogspot.com/2010/09/documento-semiestructurado.html

DOCUMENTOS NO ESTRUCTURADOS

"Los documentos no estructurados son los escritos en lenguaje natural y que carecen de etiquetas, formato y organización del contenido, también se pueden definir como “Cualquier tipo de texto que esté en una representación tabular o formato delimitado”

Los documentos de texto y su estructura. Consultado en: http://bdigital.eafit.edu.co/bdigital/PROYECTO/P006.35G633/capitulo2.pdf (17/08/2011)

No hay comentarios:

Publicar un comentario