por Yolanda de la Iglesia Sánchez
Abrir en ventana nueva |
El
adagio "una imagen vale más que mil palabras" puede servir de marco
iniciático para introducir el paradigma electrónico que es la "realidad
virtual". Pero sólo introducirlo,
porque ahora una imagen sin palabras que la describan, no tiene el mismo valor
que antaño, y no sólo eso, sino que las mismas palabras se han tenido que
volver imágenes para ser divulgadas.
Eso
ha ocurrido con el patrimonio bibliográfico y documental, que ha permanecido
escondido y ha evolucionado a la zaga de otros patrimonios como el arquitectónico
y el museístico. La gran difusión social del patrimonio cultural y su
explotación como recurso económico en las industrias culturales se ha limitado
al conocimiento de los dos últimos, hasta que el impacto de la llamada sociedad
de la información se ha introducido en el mundo de los archivos, las
bibliotecas y los centros de documentación.
Nadie
puede dudar que los archivos, las bibliotecas y los centros y redes de
documentación se han abierto a la
dinámica de las tecnologías de la información, y se han convertido en el
universo natural para la gestión del conocimiento. Todo esto ha conllevado un
cambio en los sistemas de trabajo, una nueva definición de documento, una nueva
gestión de la información y una intensificación del intercambio y acceso a la
documentación.
El
proceso está abierto y tiene su mejor
manifestación en un fenómeno que podría denominarse
"desmaterialización" del documento. Los documentos se empiezan a
convertir en algo intangible, lo cual era impensable hasta ahora según la
propia naturaleza de los mismos. El factor de intangibilidad lo ha
proporcionado la nueva realidad virtual que ha revolucionado la accesibilidad
al documento y por añadidura a la información.
La
disponibilidad de los documentos ha cambiado al someterlos al procesamiento
electrónico, y la transmisión y la comunicación de los documentos entregadas a
la aplicación de la nuevas tecnologías multimedia, hipermedia y realidad
virtual se llevan a cabo sobre todo en el mundo de las redes.
El
entorno digital está siendo objeto de numerosos estudios e investigaciones, y
como todos los fenómenos en sus primeras manifestaciones ya ha producido su
dosis de confusión terminológica.
En primer lugar se
emplea el término "archivo" con gran asiduidad, para referirse a
fondos documentales de diversas
materias y en distintos soportes, que no constituyen el genuino fondo de
archivo articulado por el principio de procedencia. La acepción de archivo se
toma como conjunto de documentos, y es
por ello que los sistemas de recuperación empleados no son los que se
ajustarían a un sistema de información
descriptiva, de almacenamiento electrónico organizado jerárquicamente de
acuerdo a las reglas de descripción multinivel y de herencia establecidas por
la norma ISAD(G).
Cabe
también referirse en este sentido a las expresiones "biblioteca
digital", "biblioteca electrónica" y "biblioteca
virtual", que además de su empleo indiscriminado, se suelen confundir
entre ellas. La biblioteca digital implica el uso de las telecomunicaciones, el
acceso puede ser remoto e independiente del lugar y número de conexiones. A
diferencia de la virtual, la digital suele estar formada por un conjunto de
conexiones a varias fuentes de información recogidas en Internet.
El
diseño y la gestión de los recursos electrónicos procedentes del patrimonio
bibliográfico y documental parte de un proceso de digitalización de los
documentos. Y es este proceso de transformación del soporte papel al soporte
digital, el que me servirá de marco de referencia para estudiar aspectos
relacionados con la conversión y el almacenamiento de los documentos y su
manipulación en el entorno digital.
El
adelanto que supone iniciar un proceso de digitalización de documentos se
manifiesta en dos propósitos sustanciales:
1. La preservación y conservación de los
documentos.
2. La difusión y accesibilidad de los
documentos.
La
intención de este trabajo es centrarse exclusivamente en el segundo aspecto.
Por ello el desarrollo de los argumentos de este estudio se fijarán en aquellos
elementos de la digitalización que tienen que ver con la recuperación y la
difusión de la documentación digitalizada, esto es, básicamente, el sistema de
consulta.
El
estudio que aquí se plantea ha surgido a partir de la exploración de seis
experiencias de digitalización diferentes, realizadas por distintas entidades,
y con fondos documentales diversos. En estas experiencias en cuanto a los
contenidos de sus fondos y de qué manera se ha resuelto su consulta, así como
su presentación a los usuarios, se basa este trabajo.
Para
mucha gente el archivo digital o la biblioteca digital evoca la imagen de un
gigantesco repositorio de información en línea, al cual los usuarios accederían
a través de una búsqueda, cuyo final feliz sería conseguir su información
[1]. Pero hasta el momento los
principales problemas de recuperación surgen en este mismo punto de partida y
se refieren a cómo encontrar la información en un entorno digital.
El
soporte digital es muy potente, pero es preciso organizar opciones amigables
para facilitar la búsqueda de información y el acceso a los servicios que puede
llegar a ofrecer.
Los
soportes digitales de información y los vehículos que la transportan, los
servidores que la almacenan y los terminales que la transforman, son ya muy
variados y todos ellos contribuyen al peculiar y novedoso fenómeno de la
digitalización [2].
En
términos generales, es injusto y hasta desproporcionado reducir el mundo
digital a la red Internet, pero como
paradigma del archivo virtual que ayuda a sustituir la autarquía documental por
la cooperación, es una realidad constante en todos los recursos sobre archivos
disponibles en la red.
La
Internet es una plataforma ideal para la materialización de la difusión de los
fondos documentales, con la construcción de un web se puede ofrecer acceso a
recursos propios, a recursos externos y a sistemas de recuperación internos y
externos (motores de búsqueda).
El
requerimiento que supone la virtualidad en Internet ha provocado que las
experiencias estudiadas estén en su mayor parte en la red. No obstante,
quisiera destacar que en la selección de los ejemplos se ha tenido en cuenta la
representación de otros entornos de trabajo para el usuario: entorno telemático
(Internet), entorno monopuesto (CD-ROM comercializado) y entorno multipuesto
(centro de investigación).
Las expectativas que se pretenden cubrir con la elaboración de esta
investigación se concentran en un objetivo general, que es observar las consecuencias
de la recuperación de información digital dentro de la estructuración de
diferentes procesos de digitalización.
Además
de esta consideración general, hay que anotar también otros objetivos más
concretos que son los que se exponen a continuación:
Objetivos específicos:
·
Recoger los requerimientos
técnicos básicos y característicos de los procesos de digitalización
(parámetros y sistemas de digitalización).
·
Evaluar la descripción y
recuperación de documentos (sistemas de consulta).
·
Presentar diversas propuestas de
edición y explotación de documentos electrónicos (sistemas de almacenamiento,
sistemas de servicio de imágenes).
Los medios empleados han sido varios, y variada ha
sido también su utilización. Para realizar el presente trabajo me he servido de
cuatro tipo de materiales:
1. Recopilación de datos en los
centros.
2.
Documentación facilitada por los
centros.
3.
Páginas web de los productores.
4.
Bibliografía.
La recopilación de datos en los propios centros ha
sido sin duda la tarea más laboriosa por su preparación. Por su parte, las
páginas web han servido para descubrir una serie de ventajas que ofrece el
acceso digital, pero también a través de este entorno se percibe una sensación
de novedad y de provisionalidad en la implementación de los proyectos,
provocada muy probablemente por la propia naturaleza de la red. Los proyectos
presentados en Internet están más basados en suposiciones que en realidades.
En cuanto al caso del almacenamiento y consulta en
disco óptico, la información se ha extraído de la propia aplicación, así como
de fuentes de información externas, pero complementarias sobre el producto y el
productor concreto que nos ocupa.
El análisis de la literatura sobre los procesos de
digitalización de los últimos años da
una idea del crecimiento del interés por la gestión de los documentos en el
entorno automatizado. En su origen, como todos las operaciones informáticas, la
digitalización tenían atribuciones puramente técnicas y su razón de ser
implicaba exclusivamente al profesional que las llevaba a cabo. Ahora estas
consideraciones están cambiando, al
incluir al cliente-usuario como máximo exponente de los objetivos a conseguir
al sumergirse en uno de estos proyectos.
Cabe destacar una cierta división de los estudios
según se refieran a bibliotecas digitales o archivos digitales. Raramente se
localizan textos que traten el desarrollo de un plan de digitalización general.
Parece claro pues que las características de los documentos y su sentido como
colección diferencia al archivo de la biblioteca y viceversa. De momento existe
cierta ventaja para las bibliotecas, las cuales ya han desarrollado plenamente
una etapa imprescindible de normalización. Los archivos están a caballo entre
la redacción de sus normas de descripción y el avance y empuje de la realidad
virtual.
Finalmente hay que
hacer notar que existe todavía poca bibliografía específica sobre la
recuperación específica de la información en la órbita digital. De momento, se
han trasladado las referencias y los parámetros de evaluación de los sistemas
automatizados de gestión de la información.
En todo sistema de almacenamiento digital de
imágenes cabe distinguir dos procesos fundamentales: el proceso de
digitalización y almacenamiento y el proceso de consulta [3]. Como ya se ha
indicado anteriormente, serían
específicamente el proceso de consulta y el formato de visualización de
resultados, los elementos que interesan en nuestro caso.
Para enfrentarme con
el estudio de los casos de digitalización que aquí se presentan he llevado a
cabo dos tipos de actuación, a saber:
A1.Visitas a los centros digitalizadores
A2. Estudio de los productos a través de sus entornos de difusión:
páginas web, y discos ópticos comercializados.
A1. Visitas
a los centros:
La idea de conocer los procesos de digitalización in
situ, me pareció bastante interesante desde el momento en que surgió la
posibilidad de realizar este estudio. Se trataba de "poner una cara"
a uno de tantos mecanismos que conocemos en sus resultados, pero que no se
suele tener la opción de contemplar directamente.
Para realizar esas visitas, desarrollé un plan de
trabajo con las consideraciones y los datos que a primera vista exigía el
conocimiento de los centros digitalizadores. Así, elaboré unas pautas para
tener un control y obtener un aprovechamiento óptimo de las entrevistas con los
responsables.
El Plan de trabajo
seguido se
detalla a continuación:
I. INFORMACIÓN
GENERAL:
Fecha de creación de la colección y del centro.
Edificio e instalaciones (distribución del espacio, sucursales, condiciones materiales, etc.)
Fondos (número total de fondos y número clasificado por tipo de fondos, crecimiento estimado para los próximos años, política de préstamos, presupuestos, etcétera).
Servicios (número y tipo de servicios...)
Usuarios (número y tipo de usuarios que utilizan la biblioteca, crecimiento estimado para los próximos años, política de préstamo, etcétera).
Personal (número de empleados, categoría y funciones que tienen, estimación de su futuro crecimiento, cuántos trabajarían simultáneamente con los ordenadores, formación de los empleados, especialmente en lo que se refiere a informática y catalogación automatizada).
Organización actual (organigrama, horarios y calendario de apertura, turnos de trabajo, circuito de los documentos, tasa de actividad periódica, informatización parcial, servicios prestados, etcétera).
Previsiones para el futuro
(proyectos propios o del ámbito bibliotecario del que se depende, integración en
redes, etcétera).
II. PROYECTO
DE DIGITALIZACIÓN:
Fechas de inicio/ finalización.
II. 1. Aspectos del
proyecto de digitalización:
1. Plan de desarrollo global que determine los objetivos globales del sistema y defina el proyecto y las prioridades. Un PDG con:
Análisis de la institución
Necesidades a cubrir
Calendario de actuación
Objetivos globales del sistema, definición del proyecto y prioridades.
2. Análisis de sistemas. Objetivos y requisitos específicos. Estudio de viabilidad.
3. Especificación de los requisitos. Objetivos y requisitos del propio proyecto.
4. Evaluación de sistemas. En qué medida los sistemas propuestos cumplían los requisitos, y por qué se solicitó un producto existente, o se desarrolló un nuevo sistema.
5. Puesta en marcha. Control de la instalación del sistema elegido.
6. Control y mantenimiento. Revisión continua y mejora del sistema
II.2. Fase de planificación
Estudio y diseño del sistema: quién realizó el estudio: un consultor exterior, un responsable del centro o un equipo de trabajo.
Análisis del sistema existente: la descripción y análisis detallado de todos los elementos y funciones del centro.
II.3. Fase de selección:
Qué sistema se escogió y por qué.
II.4. Fase de implantación
Estructuración del proyecto (selección documental, preparación de documentos y número de documentos digitalizados).
PARÁMETROS DE DIGITALIZACIÓN: resolución de imágenes (número de puntos obtenidos por imagen ppp) y el nº de niveles de gris: valores. Mejorar la calidad de lectura de los originales.
SISTEMA DE DIGITALIZACIÓN (Proceso de captura de la imagen): escáner o cámara digital (características y descripción del procedimiento)
Formatos y compresión de imágenes.
SISTEMAS DE CONSULTA: Búsqueda y Recuperación Automatizadas. Normas ISAD, consulta digital de imágenes, gestión de usuarios (registro, petición de documentación original, impresiones, etc.)
Acceso a la información para el usuario: interfaces
Visualización en monitor y manejo y tratamiento digital de imágenes: ampliaciones, reducciones, rotaciones, eliminación de manchas, imagen en negativo y relieve, marcar zonas.
Aspectos informativos del original: formato del original (medidas)
SISTEMAS DE ALMACENAMIENTO DE IMÁGENES: discos ópticos (CD-ROM, DVD)
SISTEMAS DE SERVICIO DE IMÁGENES: servicio manual, servicio automático
Impresión
III. EQUIPO INFORMÁTICO:
III.1. Tipo de programas de aplicación y características:
Sistemas de gestión de bases de datos documentales, o relacionales.
Sistemas de archivo electrónico.
Programas de reconocimiento óptico de caracteres (OCR).
Sistemas de gestión de bibliotecas: integrado o modular.
Sistemas de gestión de archivos.
IV. CONCLUSIONES:
Comentarios sobre los efectos conseguidos tras la
digitalización, situación actual, ventajas, desventajas: revisión del fondo,
manipulación del fondo original favoreciendo la preservación y conservación;
trabajo del personal; difusión de los fondos (CD-ROM, intercambio con otras
bibliotecas); servicio rápido; mejora
de las posibilidades de lectura (tratamiento de originales); reproducciones
rápidas (mejoran el original); sistemas automatizados accesibles por Internet.
A2.
Estudio
de los productos a través de los entornos de difusión
A la hora de observar las experiencias a través de los resultados, se ha tenido en cuenta la diferencia de planteamiento y la dificultad de equiparar y nivelar los tipos de información obtenidos cuando el contacto con el centro digitalizador ha sido directo.
En las experiencias volcadas en Internet, y en
CD-ROM comercializado, se ha investigado en la documentación incluida en ambos
estadios siguiendo un Método de estudio apropiado al soporte y medio de
difusión. El esquema de este método
contempla los siguientes apartados:
1º ESTUDIO DE LA PRESENTACIÓN Y
CONTENIDOS DEL PROYECTO. Navegación
por la web con una valoración de:
Diseño de las páginas (colores, tipos de letras, grafismo...)
Organización de la información (sistema de información, estructura, planificación...)
Tipos de usuarios (generales, especiales, ambos...)
Tipo de información que contiene (adecuada, satisfactoria, ...)
Idoneidad de los enlaces incluidos en las páginas (pertinencia, calidad, cantidad...)
Idoneidad de la información para los usuarios (profundidad, accesibilidad, ...)
2º ANÁLISIS DEL SISTEMA DE BÚSQUEDA
a) La base de datos:
Contenido de la base de datos: qué se está buscando para localizar las bases de datos que cubren la materia de la búsqueda, autoridad y envergadura de los productores, capacidad de cobertura (cronológica, temática, actualización, tipología documental).
Presentación de los registros: qué clase de campos incluye, qué hay en cada uno, etc.
El análisis documental: grado de coherencia en el tratamiento que recibe la información de la base de datos.
b) La recuperación de la información:
Capacidades de búsqueda del software de recuperación (para usuarios finales, para usuarios expertos y profesionales, o para ambos; operadores...).
3º ANÁLISIS DEL SISTEMA DE VISUALIZACIÓN
La interfaz de usuario: El acceso del usuario a la información: amigabilidad, fácil navegación, variedad en los formatos de salida, consistencia.
B.-
Presentación
de los resultados
Partiendo de estas dos formas de trabajo, he
confeccionado a su vez un subsistema de presentación del estudio de cada
experiencia, producido tras la elaboración de una sinopsis que contiene los
puntos que son objeto de esta investigación, y que se dividen en cinco
aspectos, que sirven para describir y distinguir cada una de las experiencias.
A partir del procesamiento de los datos obtenidos
por uno y otro método, el marco de
presentación comprende los siguientes exponentes:
I. Descripción
del centro y de sus fondos: en este punto se esbozan los aspectos generales
sobre el centro digitalizador (historia y evolución del centro) y los fondos
que alberga (materias, volumen, etc.).
II. Definición del proyecto de digitalización: con las
premisas mínimas facilitadas por los centros.
III. Análisis del Sistema de consulta de los documentos: contiene
los detalles de la observación de la recuperación de la información
digitalizada.
IV. Descripción del Sistema de visualización de los
documentos: donde se da noticia de la presentación de los documentos en
pantalla.
V. Relación
de las Características específicas del proyecto: enumeración de las
peculiaridades que cabe distinguir en cada experiencia.
ARCHIVO VIRTUAL
DE LA EDAD DE PLATA DE LA CULTURA ESPAÑOLA CONTEMPORÁNEA
(1868-1936)
FUNDACIÓN SANCHO EL SABIO: CENTRO DE DOCUMENTACIÓN DE CULTURA VASCA
Como
reflexiones finales sobre lo desarrollado en este trabajo, voy a plantear los
puntos que considero fundamentales y que representarían el sentido y la
realización de un proyecto de digitalización, qué se consigue y para qué. Por
otro lado se señalan algunas estimaciones sobre la situación de los sistemas de
consulta y de visualización de los documentos. A través de las valoraciones de
las experiencias descritas y analizadas, cabe ahora desgranar algunas
conclusiones finales que responden a su vez a una serie de interrogantes.
5.1.
Objetivos
y propósitos posibles de la digitalización
A) ¿POR QUÉ UTILIZAR EL SOPORTE DIGITAL?
Estas tecnologías permiten de una forma económica la edición o reedición de estos fondos al tiempo que posibilitan su consulta y reprografía sin necesidad de acudir a los propios materiales originales.
De esta manera, se consigue un doble objetivo:
1. propiciar la preservación y conservación de los originales.
2. facilitar el
conocimiento y la difusión de aquellos materiales considerados básicos para los
investigadores mediante la edición en soporte digital, a costes muy reducidos y
de una manera viable.
En la edición electrónica en CD-ROM, Internet u otros
soportes se ha encontrado una herramienta idónea para la difusión de fondos
museográficos, bibliográficos, y documentales mediante reproducciones
facsimilares, bases de datos con catálogos o instrumentos de descripción, etc.
La edición en soporte electrónico supone, además una notable economía en los costes de edición
respecto a la edición en papel y una ágil herramienta de consulta, ofreciendo
la información de manera estructurada y permitiendo consultas textuales.
B) ¿QUÉ BENEFICIOS OBTIENE EL
USUARIO/INVESTIGADOR?
Facilidad de acceso a unos materiales de consulta limitada.
Un servicio rápido.
Mejores posibilidades de lectura con la aplicación de los tratamientos que ofrece el software.
Obtención de reproducciones rápidas, e incluso mejores que el original.
Accesibilidad creciente a través de Internet, a fondos localizados por todo el mundo.
Utilizar en el lugar de trabajo una riquísima colección de
textos de interés histórico, filosófico, literario, etc.
C)
¿QUÉ VENTAJAS PROPORCIONA AL CENTRO
DIGITALIZADOR?
Los procesos de digitalización implican revisiones del
fondo, y manipulación del fondo original, en definitiva, el movimiento que
favorece la preservación y la conservación.
Se evita la manipulación de originales, favoreciendo la
preservación y conservación.
El trabajo del personal de servicio en sala es sensiblemente
inferior.
Se favorece el intercambio de datos con otros centros.
Se abre a los usuarios una amplia gama de servicios, como
pueden ser el acceso en línea al contenido de los libros desde OPAC's gráficos,
la consulta remota a través de las redes de transmisión de datos, la
reproducción en papel con una gran calidad o la posibilidad de trasladar esa
información a un soporte tan cómodo de manejo como los CD ROM.
5.2. Desarrollo de los sistemas de
consulta
La integración de sistemas de información constituye un
elemento primordial para el establecimiento de los sistemas de gestión del
conocimiento.
Las base de datos son en su mayoría referenciales, pero aprovechan
el entorno navegacional del hipertexto para facilitar el acceso al documento
completo si éste se encuentra en formato electrónico.
Hay iniciativas y cambios en el lenguaje y la arquitectura
sobre los que se construyen las páginas, los documentos. Todo parece indicar
que el futuro pasa por el XML (Extensible Markup Language), lenguaje que
permite que un grupo concreto de personas organice su propio lenguaje de
etiquetas para intercambiar información en un campo determinado.
Se explota una realidad nueva que es la del acceso de la
información a través de las capacidades hipertextuales: los enlaces.
No hay uniformidad en las interfaces, cada uno ofrece su
opción propia a pesar de estar tratando documentos muy semejantes en su
contenido y en su forma.
5.3.
Situación de los sistemas de
visualización
La calidad de la imagen digital es una garantía en la recuperación.
No existe un estándar de resolución, hay dos opciones
digitalizar para un acceso adecuado, o digitalizar para la conservación fidedigna
de los documentos.
Las características del documento condicionan la elección de
los parámetros.
Conviven las soluciones de digitalización del texto
original, para documentación antigua de carácter histórico, con los textos en
html o en ASCII, para los documentos contemporáneos.
Los sistemas de archivo electrónico han trabajado
específicamente los efectos de manipulación de los documentos digitales en la
pantalla, aplicación que resulta muy
versátil y llamativa para el investigador, pero que no se ha visto acompañada
de un mismo nivel de explotación en la
recuperación.
PROYECTO CLÍO |