Problemas técnicos y tecnológicos de digitalización de documentos de archivo. Cómo digitalizar tus documentos

La digitalización de archivos en papel incluye escanear y catalogar documentos. Cuanto más grande es la organización, la empresa, más complejo es su flujo de documentos, más documentos se almacenan en sus archivos y más atractivos se ven los servicios para digitalizar archivos.

Buscar ahorros

  1. A menudo para buscar en el archivo documento requerido requiere mucho tiempo y esfuerzo. O puede surgir una situación en la que varios empleados requieran el mismo documento a la vez; en este caso, debe hacer una copia.
  2. Además, vale la pena señalar que la referencia frecuente a los documentos en papel tarde o temprano conduce a su daño y, a veces, a la "pérdida" si los archivos se organizan por error en el archivo.
  3. Pero es bastante simple resolver todos estos problemas: solo necesita garantizar la digitalización de los archivos en papel, utilizar sistemas de información automatizados en su trabajo, lo que proporcionará una búsqueda rápida, así como acceso a copias electrónicas de documentos.
  4. Los beneficios de digitalizar archivos en papel son muchos. Y no solo estamos hablando de oportunidades cualitativamente nuevas para el suministro y uso de la documentación de la empresa, sino también de garantizar la seguridad de esta información.

Beneficios de los documentos digitalizados:

  • reducción de la carga en el área de fotocopias y archivos en papel;
  • la posibilidad de liberar espacio de archivo;
  • reducir el costo de mantenimiento de archivos en papel.

Digitalización de archivos en papel: etapas

Primera etapa. Toda digitalización de archivos comienza con un examen de los documentos. Como resultado del análisis de documentos, se determina la estructura de la matriz de papel, así como cuantitativa y características de calidad documentos. Sobre la base de los resultados del examen, se elige la tecnología y la digitalización de los documentos, los criterios para evaluar la calidad, se elige la composición del equipo, se acuerdan los plazos y el presupuesto.

Segunda fase es un escaneo en sí mismo. La digitalización de archivos es el proceso de creación de imágenes gráficas de un documento utilizando escáneres. Antes de traducir un documento a vista electronica, el operador seleccionará el modo de escaneo óptimo, realizará, de hecho, escanear, mientras controla la calidad de las imágenes resultantes en el monitor.

El efecto de la introducción de un archivo electrónico

La digitalización de los archivos en papel da como resultado copias electrónicas de los documentos. El equipo profesional utilizado por nuestra empresa permite escanear varios documentos a una velocidad de hasta varios miles de páginas por día, en modo por lotes. Los archivos resultantes se escriben en unidades flash, CD, DVD y otros medios.

Archivar resultados de digitalización

Inmediatamente después de que se completa la digitalización de los archivos, las imágenes gráficas se someten a un procesamiento automático: división por páginas, recorte en los bordes, alineación por líneas, eliminación de ruido, mejora de la calidad de las imágenes, etc. Puede establecer los parámetros para catalogar los documentos escaneados a su discreción, asegurando así la optimización de los procesos comerciales desde el lado de la gestión de documentos.

En la oficina, a menudo es necesario enviar Por correo electrónico copias - versiones electrónicas de documentos impresos. Estos pueden ser varios actos, facturas, cartas, contratos, estatutos, notas de oficina y cualquier otro documento posible.

En casa tenemos fotografías antiguas que se han ido deteriorando con el paso de los años y nos gustaría conservarlas.

Nos regalaron un libro interesante por un tiempo, pero quiero tenerlo en casa. ¿Cómo hacerlo todo? Nuestros documentos en papel de corta duración deben convertirse a formato electrónico, es decir, digitalizarse y guardarse.

La digitalización es la traducción de una imagen o señal analógica de audio/video a un formato digital adecuado para su grabación en un medio electrónico.

Para digitalizar imágenes de un objeto, existen dispositivos especiales: escáneres. Hay escáneres de códigos de barras, escáneres de película. Los escáneres biométricos leen un patrón de la retina o un patrón papilar de la piel de los dedos de la mano. La forma de un objeto volumétrico es leída por un escáner 3D tridimensional.

En escáneres para procesamiento portadores de papel- dibujos, fotografías, documentos de texto, la imagen se ilumina línea por línea con una lámpara especial y el flujo luminoso reflejado se enfoca en una matriz sensible a la luz. Un convertidor de analógico a digital convierte las señales eléctricas recibidas en un sistema de datos binarios, que forma una copia digital de la imagen.

La elección de un escáner depende de las tareas y las especificaciones de su aplicación. Casi siempre se utiliza un escáner en la oficina para digitalizar documentos. Incluso si las fotografías se escanean, no se les imponen requisitos de alta calidad en la oficina. La resolución de 300 dpi es suficiente para asegurar el funcionamiento preciso de los programas de reconocimiento y para obtener una buena texto legible... Cualquier escáner producido en la actualidad proporciona una resolución aceptable para el trabajo de oficina.

Esto también se aplica a la profundidad de color. Casi todos los escáneres modernos reproducen el nivel de gris necesario para los documentos impresos.

Es importante en la oficina, donde la tarea principal es digitalizar rápidamente documentos de texto por página, es automatizar el proceso de escaneado. Se pueden utilizar escáneres alimentados por hojas. Aquí, se inserta una hoja de documento en la ranura de la máquina y se tira, como en un fax, a lo largo de los rodillos guía. Tal escáner es conveniente con un alimentador automático de hojas incorporado. Cargamos varias hojas de un documento de varias páginas en la bandeja y, mientras el escáner digitaliza, al mismo tiempo estamos haciendo otra cosa. Todo es simple aquí. Si está instalado el software OCR adecuado, basta con pulsar un botón para digitalizar y guardar el documento en el formato deseado en dicho escáner.

Una solución de oficina moderna para un departamento de una empresa de diseño, por ejemplo, puede ser un escáner de formato A3 incluido en un dispositivo multifuncional junto con una impresora A3/A4. Es conveniente digitalizar y hacer copias de dibujos en tal MFP.

Está claro que escanear una revista encuadernada o la extensión de un libro en un escáner alimentado por hojas no funcionará.

Para escanear documentos a doble cara, existen escáneres dúplex, donde dos elementos de escaneo procesan ambos lados de la hoja en una sola pasada.

Una buena solución para el hogar es una impresora multifunción de inyección de tinta en color. MFP es un dispositivo multifuncional que incluye un escáner y una impresora. Tal dispositivo es también una máquina copiadora. Es decir, la impresora multifunción puede escanear automáticamente un documento e imprimir una copia del mismo: crear una fotocopia del documento.

El dispositivo compacto con funciones combinadas ocupa menos espacio en la mesa. Su costo será significativamente menor que el costo total de los dispositivos incluidos en él, si los compra por separado. En una impresora de inyección de tinta a color, hacemos fotografías y tarjetas de presentación a color de alta calidad, y con un escáner plano digitalizamos documentos, álbumes de fotos o libros necesarios.

En las próximas lecciones, aprenderemos cómo digitalizar, convertir y guardar manualmente en un escáner plano, página por página. documentos de texto.

En estos ejemplos, utilicé un MFP de escritorio A4 popular para escanear. Un dispositivo tan económico es la solución óptima para el hogar y puede ser la segunda MFP adicional en la oficina.

Supongamos que tenemos una multipágina lógicamente documento vinculado, que necesita ser digitalizado y enviado por correo a nuestra contraparte. Llamémoslo "Contrato".

En nuestro amado Windows XP, hay un "Asistente para trabajar con un escáner o una cámara digital" estándar. Para que el asistente funcione, se debe instalar un escáner en la computadora y debe estar encendido. El asistente es muy fácil de usar y hay un pequeño tutorial en la lección sobre cómo digitalizar documentos en Windows XP.

En Windows 7, la función estándar de fax y escaneo de Windows es la herramienta para crear copias electrónicas de documentos e imágenes impresos.

Entonces, leímos las lecciones y usando uno de estos programas recibimos archivos de escaneo de las páginas de nuestro contrato en uno de los formatos gráficos, han guardado y, por favor, adjúntelos a su correo electrónico, envíelos a la dirección.

Lo malo aquí es que al escanear un documento de varias páginas con estos programas, no podremos combinar los escaneos de las páginas en un solo archivo. Por supuesto, puede numerar los archivos de página en orden y comprimirlos para una distribución compacta. Pero nuestro destinatario solo podrá visualizar las páginas en un editor gráfico una a una, sin poder navegar por el documento. Es incómodo y una pérdida de tiempo. Y, en general, es inaceptable.

De hecho, con estas herramientas obtenemos fotografías digitales individuales de las páginas del documento.

Para convertir nuestros escaneos dispersos a documento único con la posibilidad de búsqueda de texto completo, necesita un programa de reconocimiento de texto. Lo mejor por hoy es FineReader.

FineReader es un programa empresa rusa ABBYY. La última versión 12 de ABBYY FineReader se lanzó en febrero de 2014. Este programa extrae datos de texto de imágenes digitales: reconoce caracteres de texto. Se puede descargar una versión de evaluación de ABBYY FineReader 12 Professional desde el recurso oficial: http://www.abbyy.ru/finereader y entrenar durante 30 días.

Es mejor cuando una de las últimas versiones pro está instalada en la computadora. A continuación, se describe el trabajo en ABBYY FineReader 10 Professional Edition.

Entonces, en las lecciones anteriores, escaneamos las páginas usando las herramientas estándar de Windows, las numeramos, las guardamos con la extensión "jpg" y las colocamos en una carpeta separada llamada "Acuerdo".

Entonces, utilizando las maravillosas capacidades del programa de reconocimiento, podemos convertir fácilmente varias imágenes en formatos editables.

Sobre esto, por favor, en la próxima lección: Escaneo en ABBYY FineReader.

Y así, leemos estas lecciones y vemos qué ventajas nos da el programa de reconocimiento. En lugar de la tediosa y lenta escritura de un libro o folleto, simplemente escaneamos las páginas necesarias de FineReader, las editamos, si es necesario, y las guardamos en el formato seleccionado. Así, puede escribir rápidamente, por ejemplo, un artículo o un abstracto.

Y cómo escanear las páginas de los libros y digitalizar libros, leemos en el tema: Digitalización de un libro.

Para concluir el tema, resumamos: un escáner en combinación con un programa de reconocimiento es un reemplazo racional para escribir desde el teclado. Al tener una versión en papel - texto impreso en una impresora o en una tipografía, simplemente lo escaneamos en lugar de ingresarlo desde el teclado. Otra área popular de aplicación del escáner es la digitalización de una variedad de productos impresos: etiquetas, postales, fotografías, revistas, libros.

¿Tiene serios problemas para almacenar documentos en papel? ¿Los estantes están repletos de carpetas absurdamente infladas y pasas tres horas buscando el papel correcto? Entonces es hora de comenzar a digitalizar documentos, lo que hará que su oficina o apartamento esté más limpio y el método de búsqueda sea más fácil y conveniente. Cree su propia biblioteca digital, edite, copie y mueva archivos digitales como desee. La capacidad de crear documentos digitales es uno de los beneficios de la civilización. ¡Así que aprovéchalo!

Antes de atreverse a digitalizar sus documentos, debe saber que existen dos formas de almacenarlos: como imágenes y como archivos de texto. El almacenamiento de imágenes requerirá mucho más espacio en el disco duro, pero aún podrá conservar el estilo del documento original. Convertir las imágenes escaneadas en un archivo de texto requerirá una inversión adicional de tiempo, ya que es necesario realizar el proceso de reconocimiento óptico de caracteres OCR (aunque, para ser precisos, este nombre no es del todo correcto, ya que aquí estamos hablando de trabajar con información digital, sin embargo, como suele a veces el término atascado).

¿Cómo elegir un formato de almacenamiento de documentos? Es muy sencillo: si el documento original está escrito a mano y es importante que conserve su "especificidad" (una carta de un ser querido) o si el documento es, por ejemplo, una obra de arte, guárdelo como imagen (a veces, la escritura a mano reconocible es tan importante como las palabras escritas). Otra razón más prosaica para guardar documentos escritos a mano como imágenes es la falta de una solución de software disponible comercialmente adecuada para interpretar caracteres escritos a mano. Hasta ahora, esta tecnología está estancada en PDA y tabletas, en las que se implementa de una forma ligeramente diferente a la que necesitamos. Cuando trabaja con su tableta, escribe caracteres a mano, ingresándolos en orden, y el programa los convierte en texto escrito en tiempo real. Reconocer la letra de una sola persona a partir de un documento escaneado es una cuestión de futuro.

Escáneres

Ya sea que almacene sus documentos como imágenes o como archivos de texto, necesita un escáner para digitalizarlos. Si desea digitalizar relativamente un gran número de documentos, entonces una impresora multifunción o un escáner plano serán suficientes para usted. Su único inconveniente es su velocidad de operación relativamente lenta. Tenga en cuenta que solo los modelos más caros tienen una función de alimentación automática de hojas para manejar documentos de varias páginas.


Entre los mejores modelos se encuentran el ScanSnap S1500 de Fujitsu y el ScanJet Professional 3000 de HP. Estos dispositivos promedian velocidades de escaneo de documentos de 20 páginas por minuto o más. Al mismo tiempo, ScanJet Professional 3000 tiene un mecanismo de alimentación de papel más confiable, mientras que ScanSnap S1500 tiene un software más avanzado. Ambos escáneres tienen aproximadamente el mismo rango de precios, por lo que depende de usted.

software OCR

La mayoría de los escáneres vienen con software para realizar OCR, que está instalado en su computadora. Si no está satisfecho con el software que lo acompaña o no, estos programas son bastante comunes y se pueden comprar por separado. Existen las siguientes ofertas de mercado:

FineReader 9 Express de ABBYY, $100 por la versión regular y $400 por la versión profesional de Pro 10;
... OmniPage 17 Standard de Nuance, $150 por la versión regular del programa y $500 por la versión profesional;
... Acrobat X Standard de Adobe, $299 regular y $449 profesional;
... Nuance PaperPort 12 Standard cuesta $ 100 para la versión regular y $ 200 para la versión profesional del software, aunque no hay función de OCR, solo la opción de administrar documentos escaneados.

Permiso

Para documentos almacenados en forma de imágenes, por regla general, es suficiente configurar la resolución de 150 a 200 ppp, pero el software OCR funciona mucho mejor si las imágenes se guardan a una resolución más alta: 300 ppp. Todo depende de lo que necesites. Si solo desea mantener al menos una legibilidad mínima de su documento escaneado, puede reducir los requisitos de resolución. si es importante para ti alta calidad, luego auméntelo en consecuencia.

OCR en la web

Existen varios servicios en línea que brindan un servicio para reconocer documentos escaneados. Entre los más famosos están los recursos gratuitos. OCR gratuito , NuevoOCR y OCR en línea... Son geniales para proyectos pequeños, es decir, solo funcionan con documentos pequeños. Primero debe escanear el original en la memoria de la computadora y luego cargar la imagen del documento en el sitio web. Naturalmente, cada recurso tiene sus propias limitaciones tanto en términos de volumen como de contenido del documento. Entonces, las aplicaciones web solo reconocen texto, sin líneas ni caracteres adicionales que estén presentes en la página.

Servicio OCR gratuito es gratis, pero el tamaño de la descarga no puede exceder los 2 MB y no puede contener más de 5000 píxeles, que es aproximadamente 50 ppp para un documento estándar. Además, no puede procesar más de 10 documentos de este tipo por hora. Servicios del sitio NuevoOCR también puede usarlo de forma gratuita, pero su interfaz es extremadamente primitiva, pero el volumen de documentos procesados ​​​​es 2.5 veces más, hasta 5 MB. Y finalmente, el recurso. OCR en línea requiere una cuenta gratuita, pero le permite cargar hasta 15 archivos por hora de hasta 4 MB a una resolución de aproximadamente 200 ppp por página. Si no está satisfecho con tales volúmenes, puede comprar acceso pago por $ 3,95 (8 centavos por página) y poder procesar hasta 50 documentos a la vez, o pagar $ 49,95 por procesar hasta 5000 (1 centavo por página). ). Esta aplicación web funciona tanto con elementos de texto como gráficos, pero, por supuesto, está lejos de los estándares Acrobat X o FineReader 10.

libros electrónicos

Probablemente, a usted, como a mí, le encanta el olor de un libro de verdad, le encanta la sensación del papel grueso y el aspecto de los hermosos gráficos. Sin embargo, hoy en día, cada vez más personas prefieren lidiar con libros electrónicos, que se leen con los llamados lectores electrónicos especiales, tabletas, teléfonos inteligentes, reproductores y otros dispositivos portátiles. Gran cantidad Las tiendas en línea ofrecen cantidades gigantescas de contenido. Pero, ¿qué sucede si desea su propia colección de libros electrónicos que no están disponibles digitalmente?

Para convertir sus libros "físicos" favoritos en libros electrónicos, primero debe escanearlos y luego traducirlos a formato de texto usando el programa OCR. Es tedioso incluso si utiliza un escáner FLATBED muy rápido. Estos escáneres se parecen a las "fotocopiadoras" y tienen una cubierta a presión, por lo que pueden escanear no solo hojas individuales, sino también libros completos. Si estás listo para destripar tu libro favorito, puedes usar el escáner SHEETFED, que funciona como un fax, es decir, con páginas individuales (como el ScanSnap S1500 de Fujitsu y el ScanJet Professional 3000 de HP).

Después de haber traducido sus documentos, libros de texto o libros a formatos PDF, Word o fb2, puede usar programas especiales para organizar, editar o leer documentos electronicos... Por ejemplo, Calibre o Stanza. - Organizador y editor gratuito para su colección de libros electrónicos. El programa ayuda a trabajar con el catálogo: organice, clasifique, comente, busque, guarde libros nuevos y antiguos en el disco duro de su computadora o en la memoria de un lector electrónico.

Cuanto más grande es la organización de la que habla la empresa, más documentos se almacenan en su archivo, más complicado es su flujo de trabajo, más atractivos se ven los servicios para digitalizar archivos. Entonces, lo que es la digitalización de archivos es el proceso de digitalización y catalogación de documentos.

Inconvenientes al trabajar con archivos en papel

Entonces, en archivos grandes para buscar el documento requerido muy a menudo tienes que gastar mucho tiempo y energía. Además, los documentos más utilizados a lo largo del tiempo pueden dañarse o incluso "perderse" si se colocan por error en el archivo. A menudo, en cualquier tipo de negocio, ocurren situaciones en las que se requiere una alta eficiencia en el suministro de información: a veces es necesario preparar rápidamente documentos para firmar, hacer copias en papel o digitales, unirlos con cuidado; cuando se trabaja con archivos en papel, se pierde la eficiencia. Esta no es una lista completa de los inconvenientes que uno tiene que enfrentar cuando trabaja con archivos en papel. Pero al mismo tiempo, existe una forma bastante simple y elegante de resolver el problema: la digitalización de documentos.

¿Beneficios de digitalizar archivos?

  • cabe destacar la disminución de la carga en los archivos en papel, así como en el área de fotocopias. Entonces, ahora, si varios empleados de la organización necesitan un documento al mismo tiempo, no es necesario fotocopiarlo.
  • la digitalización de documentos puede reducir significativamente los costos de mantenimiento archivo de papel, así como liberar espacio que antes se utilizaba para almacenar archivos en papel.

¿Cómo va el proceso de digitalización de documentos?

  • Especialistas especialmente capacitados se dedican a clasificar documentos (en el territorio de su empresa o entregarlos en el territorio de una organización que digitaliza archivos), luego, utilizando escáneres modernos, digitalizan el fondo del archivo en documentos completos o individuales.
  • Los códigos de barras y los documentos impresos se convierten automáticamente en formato electrónico mediante el sistema de reconocimiento óptico de caracteres. Al mismo tiempo, se guardan los datos clave de los documentos: nombre, fecha, tipo, contraparte, etc.
  • Para evitar posibles distorsiones al reescribir datos de contacto, los teléfonos para digitalizar información manuscrita al digitalizar archivos utilizan un sistema de doble entrada. Es decir, la digitalización de documentos en el futuro le dará la oportunidad de realizar una búsqueda operativa completa por palabras clave o buscar por ciertos tipos de documentos/contrapartes.

Gestión de archivos

Los archivos electrónicos le permiten administrar los archivos obtenidos como resultado del escaneo. Después de la digitalización de los archivos, los documentos en papel son objeto de sistematización y descripción. Se cosen, se compila un catálogo completo sistematizado de documentos, teniendo en cuenta las necesidades y especificidades de la empresa cliente. Esto permite en el futuro ahorrar significativamente tiempo y esfuerzo al trabajar con archivos.

Digitalización de archivos

ES DECIR. Jvorova

El proceso de digitalización de documentos para crear un archivo electrónico

El artículo está dedicado al proceso de digitalización, el mecanismo más conveniente para almacenar y usar información en las condiciones modernas. El autor examina los puntos principales del proceso de digitalización de materiales de archivo, incluido el análisis formas posibles conversión de documentos a formato electrónico, categorías de documentos para digitalización, formatos de almacenamiento para documentos electrónicos e investigación de estándares modernos de digitalización. El artículo también analiza las condiciones necesarias para crear un archivo virtual de personajes o eventos históricos en un contexto moderno. Atención especial el autor presta atención a las peculiaridades de organizar un recurso electrónico, examina los proyectos modernos existentes sobre este tema y analiza las posibles dificultades que un investigador puede enfrentar al crear un archivo electrónico.

Palabras clave: digitalización, documento de archivo, fondo electronico uso, archivo virtual.

realidades vida moderna exigen cada vez más de nosotros el uso activo de las nuevas tecnologías de la información. La era de la información también está haciendo sus propios ajustes al mundo del diálogo entre las fuentes de archivo y el investigador. Las tecnologías digitales modernas permiten implementar las ideas más globales para crear un campo de almacenamiento alternativo: almacenar documentos en un plano virtual.

La digitalización de documentos de archivo es, con mucho, la herramienta más conveniente para preservar y usar información. Permite un almacenamiento más seguro y económico, fácil búsqueda y uso.

© Khvorova I.E., 2017

información, así como para acceder rápidamente a los materiales de archivo. El proceso de digitalización de documentos se basa en la idea de formar un fondo de uso electrónico unificado (en adelante, EPF). EPF es una colección de copias electrónicas de documentos de archivo que se registran en medios digitales y están destinados a ser utilizados en lugar de documentos originales1. Un punto importante en la creación de un ESP es la necesidad de regular el proceso de su creación.

Según el Jefe Adjunto de la Agencia Federal de Archivos O.V. Naumov, los principales objetivos de la digitalización de documentos son ampliar y simplificar el acceso a los documentos del fondo de archivo, garantizar la seguridad de los originales retirándolos gradualmente del uso, brindar acceso al fondo electrónico y acelerar el proceso de provisión pública servicios2.

Consideremos los puntos principales del proceso de digitalización. En primer lugar, hay que tener en cuenta que el fondo de archivo Federación Rusa almacena una amplia gama documental. Así, antes de empezar a escanear los propios documentos, es recomendable digitalizar aparato científico y de referencia archivar, crear inventarios electrónicos para la recuperación de datos. La digitalización inicial de los inventarios del archivo permite al usuario conocer la lista de documentos almacenados sin salir de casa y solicitar documentos de interés por Internet. En este caso, también es necesario tener en cuenta el hecho de la edición científico-técnica de los encabezados de los casos: solo si se mejora el inventario, es posible comenzar la digitalización del fondo.

Las categorías de documentos para digitalización incluyen no solo documentos para los que existe una amenaza de pérdida de información, sino también los materiales y documentos más valiosos y únicos en demanda. Los criterios para los documentos sobre la unicidad y el valor de los documentos son algo vagos, y la demanda no es constante, por lo tanto, al elegir los materiales de digitalización, a menudo surge la pregunta: ¿qué documentos deben digitalizarse en primer lugar? Puede ser más fácil lograr un mejor muestreo si el proceso de selección involucra más que solo miembros. comisión de expertos archivo, sino también profesionales involucrados: historiadores, politólogos, sociólogos, figuras públicas, etc. El proceso de creación de un grupo de trabajo de este tipo requiere una regulación clara. Cabe señalar que, a pesar de los criterios de selección formulados3, no son archivos obligatorios y regionales

tiene derecho a elegir los documentos que necesitan ser digitalizados en primer lugar.

La elección del método de digitalización es importante, ya que el medio y formato de presentación del material también lleva información útil para el trabajo del investigador, por lo que es muy importante transmitirlo en la forma más precisa comparable al original.

En la digitalización directa de documentos, es importante observar todas las medidas de seguridad al trabajar con el original, se debe prestar especial atención al escanear libros y actas antiguas (luz, impresora, el comportamiento de un especialista durante la digitalización debe cumplir con los estándares aceptados ). En esta etapa, las capacidades financieras del proyecto de digitalización juegan un papel clave: la elección del equipo para escanear determina el grado de seguridad de este proceso para el original. La elección de un dispositivo de hardware más económico implica inevitablemente el riesgo de daños irreparables en los documentos y también reduce las posibilidades de realizar una copia de reemplazo comparable a todo color4.

Al digitalizar un documento, se realizan al menos dos copias del original: una copia de trabajo y una copia maestra. Ambos materiales deben ser marcados e inscritos en un registro especial. Gracias a un sistema de registro de este tipo, la búsqueda del documento escaneado será más rápida y cómoda para el usuario, y las credenciales facilitarán el seguimiento del documento en general. sistema de informacion archivo.

Entre los formatos para almacenar imágenes, los más difundidos entre los archivistas son los formatos TIFF y JPEG. El formato TIFF debe su popularidad a su capacidad para preservar la calidad de la imagen gracias a los algoritmos de compresión de datos sin pérdidas. El formato JPEG está muy comprimido pero degrada la calidad de la imagen. Es posible que los cambios no sean visibles a simple vista, pero la imagen comprimida mostrará contrastes o píxeles nítidos. Por lo tanto, JPEG no se puede utilizar como formato intermedio para el procesamiento de imágenes. Solo se permite guardar la versión final en JPEG. En cuanto a otros tipos de documentos electrónicos y los formatos más preferidos para almacenarlos, existen documentos de texto (ms-word, txt, pdf, html, xml, rtf), video (mov, avi, mpeg, mp4) y audio (wav , aiff, mp3), dibujos (autocad), gráficos y diagramas (tiff, pcx), bases de datos en forma de hojas de cálculo y bases de datos relacionales (xls, xml, html, mdb). Para documentos fotográficos, también se acepta el formato pdf. La matriz de datos recibidos se puede utilizar para la transmisión a través de canales digitales,

almacenados en medios ópticos digitales (discos CD-R, DVD-R, CD-RW regrabables, DVD-RW, DVD-RAW de una sola escritura), magnéticos (discos duros, disquetes, cintas magnéticas), unidades flash, etc. D.

Los requisitos para la calidad de las copias digitales resultantes no están claramente formulados. No existen criterios para evaluar la calidad de las copias electrónicas de los documentos en papel: los parámetros de imagen, la reproducción de tonos (contraste), el brillo, el ruido, la precisión del color, la nitidez, la resolución, las distorsiones geométricas, etc. serían útiles para Rusia. La norma nacional de EE. UU. ANSI/AIIM MS44 "Directrices para el control de calidad de los escáneres de imágenes" establece y divulga la terminología básica, los parámetros básicos y los criterios para evaluar la calidad del escaneo, así como los enfoques para su medición práctica. Sobre esta base, teniendo en cuenta los requisitos modernos en 2000, se desarrollaron estándares internacionales ISO para evaluar la calidad del escaneo de documentos en blanco y negro.

Después de la digitalización, el original vuelve a almacenarse en el archivo y las copias realizadas se agregan al fondo electrónico del usuario y quedan disponibles para los investigadores.

La búsqueda de una solución al problema del almacenamiento y uso operativo de los documentos de archivo comenzó a mediados de la década de 1990, cuando la Biblioteca del Congreso de los Estados Unidos inició una digitalización total de la colección existente de microfilmes (como colección independiente y como principal portador de seguros y fondos de usuario). En el proceso de digitalización, los especialistas estadounidenses se enfrentaron a la necesidad de desarrollar enfoques uniformes para la implementación de los procesos de transferencia de información de los soportes materiales a la forma electrónica, es decir, era necesario regular los procesos de digitalización.

Según el nivel de su regulación, los estándares de digitalización modernos se pueden dividir en 3 categorías de estándares: estándar internacional, nacional y organizacional. El estándar internacional ISo5 está siendo desarrollado por un grupo de científicos, su uso brinda beneficios tecnológicos, económicos y sociales, pero no es obligatorio para ningún país participante de la organización ISO. La norma nacional es de uso obligatorio por parte de las autoridades el poder del Estado diferentes niveles, se está desarrollando para mejorar el procedimiento de digitalización, teniendo en cuenta las especificidades de la legislación, los estándares de documentos

ciones en un país en particular. El estándar de la organización enfatiza los detalles de una empresa en particular en el proceso de traducir un documento a formato electrónico y su posterior almacenamiento y uso. El más famoso norma nacional que regula el proceso de digitalización es el “S6: Digitalization Standard” 6, puesto en vigencia por el Comité Nacional de Normalización de Australia y Nueva Zelanda en 2006.7 Desafortunadamente, Rusia no cuenta con un documento similar que regule los procesos de digitalización y la creación de ESP. ..

En 2012, los empleados del Instituto de Investigación Científica de Documentación y Asuntos de Archivos de toda Rusia (VNIIDAD) y la Agencia Federal de Archivos (Rosarkhiv) desarrollaron " Pautas sobre copia electrónica de documentos de archivo y gestión de la matriz de información recibida”. Los modelos para estas guías son el Estándar de Digitalización S6 y las Guías Técnicas de FADGI. Para continuar trabajando en esta dirección, parece oportuno desarrollar una Estrategia para la elaboración y actualización de actos normativos y metodológicos sectoriales que regulen las distintas áreas de actuación en el campo de la informatización de los asuntos archivísticos, así como la creación de normas y plan de largo plazo para su implementación. Los desarrolladores han asignado puntos clave que hay que tener en cuenta a la hora de elaborar un documento normativo.

1. La estructura y el contenido de los documentos desarrollados e implementados de los sistemas de normalización nacionales e internacionales se deben a las especificidades marco legal el país de donde son originarios. Por lo tanto, su traducción directa y uso en la Federación Rusa requiere un enfoque equilibrado.

2. Es necesario crear más de uno documento reglamentario que regulan los temas de digitalización, sino un conjunto de actos jurídicos normativos que describen los requisitos para todas las etapas y aspectos de este proceso.

3. La estructura y el contenido general de esta documentación reglamentaria y metodológica pueden basarse en contrapartes extranjeras seleccionadas por expertos de la industria como ejemplos más cercanos y adecuados a las condiciones rusas. Al mismo tiempo, los desarrollos nacionales deben reflejar completamente los detalles de todos los procesos y aspectos de la digitalización (incluidos los requisitos de equipo, personal, procedimientos y gestión de calidad) inherentes a Rusia8.

La digitalización de documentos es una medida necesaria para organizar un acceso rápido a los documentos de archivo. La disponibilidad es definitivamente

Este conjunto de documentos le permite crear un recurso de información nuevo, fácil de usar y científicamente útil: un archivo virtual. Se pueden ver ejemplos de dichos depósitos virtuales en el sitio web de los Archivos Estatales de Literatura y Arte de Rusia.

El archivo virtual de I.A. Bunin es un recurso con una clasificación conveniente de los documentos enviados y una interfaz fácil de usar. Los documentos se dividen en tres grupos: "Manuscritos", "Recortes de periódicos y revistas", "Materiales visuales" y son copias escaneadas de los originales de los fondos de los Archivos Estatales de Literatura y Arte de Rusia y el Archivo de la Diáspora Rusa. en Leeds9. Los desarrolladores del proyecto describen los puntos clave para la implementación de dichos proyectos: cuestiones financieras, el problema de la fragmentación de documentos de archivo y la necesidad de negociaciones con repositorios de diferentes instituciones e incluso países para recopilar el material necesario y, finalmente, la solución de problemas legales. problemas - ya que la publicación electrónica de materiales también se aplica Derechos de autor... El recurso representa un ejemplo positivo de la implementación de un proyecto para crear un archivo virtual. El sitio de los Archivos Estatales de Literatura y Arte de Rusia también ofrece familiarizarse con estos excelentes ejemplos de repositorios electrónicos, como un recurso dedicado a los documentos. guerra patriótica 1812 y la Primera Guerra Mundial.

Los creadores del repositorio electrónico llamado Archivo Virtual Reunido de Osip Mandelstam fueron la Universidad de Oxford y la Sociedad Mandelstam. Los desarrolladores del proyecto se propusieron identificar, describir y colocar en Internet todos o el mayor número posible de materiales creativos y biográficos conservados de Osip Mandelstam, independientemente de su ubicación física10. Al mismo tiempo, el proyecto combina manuscritos, transcripciones de textos, así como comentarios a los mismos.

La búsqueda de documentos es la etapa más importante en la creación de este tipo de proyectos. Este proceso se complica por el hecho de que es posible que algunas de las colecciones previamente conocidas e introducidas ya no existan. Una vez a la venta en la década de 1990, cambiaron de propietarios, incluso cuyos nombres no siempre es posible establecer. En otros casos, los propietarios no pueden encontrar ciertos autógrafos o documentos. Esto se explica completamente por el hecho de que la adquisición de fondos de manuscritos de archivo con documentos

líderes de la diáspora rusa se llevó a cabo principalmente a través de donaciones y no fue sistemático11. Los desarrolladores señalan que sucede lo mismo con los archivos del gobierno. Entonces, en los Archivos Nacionales de Francia, durante varios años, no pudieron encontrar los documentos de matrícula de O.E. Mandelstam (fueron redescubiertos en abril de 2008) 12.

Es importante señalar que el archivo virtual de O.E. Mandelstam no solo es un ejemplo exitoso de la implementación de un proyecto de este tipo, sino que también, gracias a una descripción detallada del proceso de creación de dicho archivo en el sitio web, es una especie de tutorial para sucesores e investigadores del proceso de digitalización.

Un análisis de los proyectos rusos implementados para la creación de repositorios virtuales de materiales históricos enfatiza el problema de la fragmentación de documentos y la complejidad de su búsqueda. Por lo tanto, al preparar un proyecto, es importante centrarse en la posible cooperación con archivos extranjeros.

Así, el papel del trabajo conjunto, proyectos conjuntos sobre la creación de un único campo virtual para el almacenamiento de materiales de un mismo tema, es cada vez mayor.

Al digitalizar, es necesario prestar atención al proceso de muestreo de documentos para convertirlos en formato digital, así como a la selección de equipos de escaneo de alta calidad para garantizar un proceso de digitalización que sea seguro para los originales. Sin embargo, por el momento, uno de los problemas más serios en esta área sigue siendo la necesidad de regular el proceso de digitalización (incluyendo Descripción detallada el proceso de muestreo de materiales y consolidación de la base terminológica). El proceso de creación de un archivo virtual sigue siendo laborioso e inalcanzable para la mayoría de los investigadores sin un estándar apropiado aprobado por ley.

Notas (editar)

Recomendaciones metódicas para la copia electrónica de documentos de archivo y gestión de la matriz de información recibida. [Recurso electrónico] URL: http://archives.ru/documents/rekomend_el-copy-archival-documents/razdel-2.shtml (fecha de acceso: 13/05/2016). Características de la digitalización de documentos en archivos modernos... [Recurso electrónico] URL: https://www.pcweek.ru/ecm/article/detail.php7ID-154329 (fecha de acceso: 13/05/2016).

Yumasheva Yu.Yu. Los archivos y la "carrera armamentística digital" // Informática histórica. 2013. Nº 3. Pág. 93.

ISO es la Organización Internacional para la Estandarización. Desarrollador y editor estándares internacionales... [Recurso electrónico] URL: http: //www.iso. org/iso/ru/ (fecha de acceso: 13/05/2016).

Informe sobre el trabajo de investigación sobre el tema 2.2.4 "Desarrollo de un borrador de estándar industrial para crear copias electrónicas de documentos de archivo", el Plan de trabajo de investigación y desarrollo realizado sobre la base de la orden estatal de la Agencia Federal de Archivos para 2014 No. 89 de 26.12.2013 (primera etapa) "Investigación y análisis de documentación reglamentaria y metodológica extranjera que rige la digitalización de documentos de archivo" / Yu. Yu. Yumashev. M.: VNIIDAD, 2012. S. 84-163. En el mismo lugar. pág. 20.

Archivo electrónico unido de Ivan Bunin. [Recurso electrónico] URL: http://www.bunin-rgali.ru/ (fecha de acceso: 13/05/2016). El archivo virtual reunido de Osip Mandelstam. [Recurso electrónico] URL: http://mandelstam-world.info/intro.php (fecha de acceso: 13.05.2016).

Popov AV Emigración rusa y archivos: Documentos de la emigración rusa en los archivos de Moscú: problemas de identificación, adquisición, descripción y uso (Materiales para la historia de la emigración política rusa. Número 4). M.: RGGU, 1998. S. 150-151.

El archivo virtual reunido de Osip Mandelstam.