"Como la palabra lo indica "son aquellos que tienen una estructura y que además contienen etiquetas cuyo signi cado semántico va más allá del propio texto de la misma", es decir que cuentan con un orden que permite que el documento sea entendido por cualquier persona".
ADIEGO, Rodriguez Joaquin. "La estructura de los documentos en el ámbito de recuperación de información: propuestas para su compresión, indexación y recuperación. 2004. p6. disponible en http://www.infor.uva.es/~jadiego/files/tesis.pdf
DOCUMENTO SEMIESTRUCTURADO
"Son aquellos documentos que contienen datos que carecen de rigidez, esquema regular, o cambios constantes en el esquema.
Los datos semiestructurados pueden ser irregulares o incompletos y tienen una estructura que puede cambiar rápido o impredeciblemente"
Tomado de http://recuperaciondinformacion.blogspot.com/2010/09/documento-semiestructurado.html
DOCUMENTOS NO ESTRUCTURADOS
"Los documentos no estructurados son los escritos en lenguaje natural y que carecen de etiquetas, formato y organización del contenido, también se pueden definir como “Cualquier tipo de texto que esté en una representación tabular o formato delimitado”
Los documentos de texto y su estructura. Consultado en: http://bdigital.eafit.edu.co/bdigital/PROYECTO/P006.35G633/capitulo2.pdf (17/08/2011)
No hay comentarios:
Publicar un comentario