Transferencia a formato digital de documentos de archivo. Escaneo de archivos: cómo se digitalizan los documentos de archivo

digitalización archivos de papel incluye escaneo y catalogación de documentos. Cuanto más grande es la organización, la empresa, más complejo es su flujo de documentos, más documentos se almacenan en sus archivos y, en consecuencia, los servicios de digitalización de archivos parecen más atractivos.

Ahorro en búsqueda

  1. A menudo para archivar documento requerido requiere mucho tiempo y esfuerzo. O puede surgir una situación en la que varios empleados requieran el mismo documento a la vez; en este caso, debe hacer una copia.
  2. Además, vale la pena señalar que el acceso frecuente a los documentos en papel tarde o temprano conduce a su daño y, a veces, a la "pérdida", si los casos se colocan por error en el archivo.
  3. Pero resolver todos estos problemas es bastante simple: solo necesita garantizar la digitalización de los archivos en papel, utilizar sistemas de información automatizados en su trabajo que proporcionen una búsqueda rápida, así como acceso a copias electrónicas de documentos.
  4. La digitalización de archivos en papel tiene muchas ventajas. Y no solo estamos hablando de oportunidades cualitativamente nuevas para el suministro y uso de la documentación de la empresa, sino también de garantizar la seguridad de esta información.

Beneficios de los documentos digitalizados:

  • reducción de la carga en el área de fotocopias y archivos en papel;
  • la posibilidad de liberar espacio de archivo;
  • reducir el costo de mantenimiento de archivos en papel.

Digitalización de archivos en papel: etapas

Primera etapa. Todo trabajo de digitalización de archivos comienza con el examen de los documentos. Como resultado del análisis de documentos, se determina la estructura de la matriz de papel, así como cuantitativa y características de calidad documentos. Sobre la base de los resultados del examen, se realiza la elección de la tecnología y digitalización de los documentos, los criterios de evaluación de la calidad, la elección de la composición del equipo, los plazos de ejecución y el presupuesto.

Segunda fase es un escaneo directo. La digitalización de archivos es el proceso de creación de imágenes gráficas de un documento utilizando escáneres. Antes de convertir el documento en formato electrónico, el operador seleccionará el modo de escaneo óptimo, realizará, de hecho, el escaneo, mientras controla la calidad de las imágenes resultantes en el monitor.

El efecto de la introducción del archivo electrónico.

El resultado de la digitalización de los archivos en papel son las copias electrónicas de los documentos. El equipo profesional que utiliza nuestra empresa le permite escanear varios documentos a velocidades de hasta varios miles de páginas por día, en modo por lotes. Los archivos resultantes se escriben en unidades flash, CD, DVD y otros medios.

Archivar resultados de digitalización

Inmediatamente después de que se completa la digitalización de los archivos, las imágenes gráficas se someten a un procesamiento automatizado: división en páginas de pliegos, recorte a lo largo de los bordes, alineación por líneas, eliminación de ruido, mejora de la calidad de la imagen, etc. Puede establecer los parámetros para catalogar los documentos escaneados a su discreción, asegurando así la optimización de los procesos comerciales desde el lado de la gestión de documentos.

En la actualidad, se presta cada vez más atención a los problemas de Propiedad cultural. En este sentido, se aprueba programas gubernamentales, dentro de los cuales, según la intención de sus creadores, el uso de nuevas tecnologías, enfoques innovadores, así como la experiencia mundial garantizarán la seguridad patrimonio cultural, documentos históricamente significativos. Por lo tanto, hoy los archivos de Rusia están convirtiendo documentos en papel a formato electrónico. Sobre cuál fue el comienzo de este trabajo a gran escala, qué dificultades enfrentan los archiveros y cómo resuelven los problemas de preservación de documentos digitalizados, Subdirector de la Agencia Federal de Archivos (Rosarchive) Oleg Naúmov le dijo a un corresponsal de PC Week/RE Olga Zvonareva.

PC Week: Cuéntenos cómo comenzó el proceso de digitalización de documentos de archivo, ¿cuáles son las características de este trabajo?

Oleg Naúmov: La tarea de conversión masiva de documentos de archivo a formato electrónico se estableció en el programa Sociedad de la Información (2011-2020). Esta no es una tarea fácil en absoluto. Además, una cosa es digitalizar documentos y otra cosa es digitalizar aparato científico de referencia(NSA), sin la cual no se puede encontrar documento requerido. Por ello, cuando hace dos años se abrió la posibilidad de financiación normal de obra en el marco de la ley federal programa objetivo"Cultura de Rusia 2012-2018", en primer lugar, comenzaron a crear en en formato electrónico NSA, lo que le permite buscar documentos de manera eficiente.

Semana de PC: ¿Qué software usado para esto?

ES ÉL.: Mucho antes de la adopción del programa "Sociedad de la información", los Archivos federales comenzaron a desarrollar el software estandarizado de toda Rusia para organizar la contabilidad de documentos: el paquete de software "Fondo de archivo". sistema propietario Federación Rusa, introducido a nivel de archivos federales, regionales y municipales. Con su uso, se creó un catálogo de valores central, alojado en el portal Archivos de Rusia. Inicialmente, el Fondo de Archivo se creó como un aparato de contabilidad, pero luego comenzó a utilizarse como un aparato de búsqueda. Ahora, varios archivos utilizan motores de búsqueda especializados.

PC Week: ¿Qué experiencia de archivo fue fundamental en la digitalización de inventarios?

ES ÉL.: El Archivo Histórico Estatal Ruso en San Petersburgo fue el primero en digitalizar todos los inventarios, únicamente debido a las circunstancias. Cuando surgió la duda sobre su mudanza, se escanearon los inventarios y se utilizaron sus imágenes electrónicas en todas las etapas de la mudanza, es decir, se rastreó cada caja, cada caja.

Fue una buena experiencia, pero desde el punto de vista del desarrollo de las tecnologías de la información, no tuvo mucho éxito. Aunque fue posible familiarizarse con ellos en la sala de lectura y en línea, la colección de imágenes gráficas no permite la búsqueda automática. Donde se brinda mayor comodidad a los usuarios mediante inventarios traducidos a un formato de base de datos, con posibilidad de búsqueda simple y avanzada. Rosarchiv comenzó a financiar activamente estos trabajos. Hasta la fecha, se han realizado alrededor del 20-30% de los inventarios de los archivos federales.

PC Week: ¿A qué desafíos se enfrentan los archivos al digitalizar documentos?

ES ÉL. El primer problema es el gran volumen. Volumen total Fondo de archivo La Federación Rusa cuenta con 494 millones de archivos, de los cuales el 9% se encuentran en los archivos federales.

Pero lo más difícil es determinar qué documentos se deben digitalizar. La respuesta más simple es la más buscada. ¿Y cómo determinar esta demanda? Hoy necesitamos una cosa, mañana otra. Y en tiempo soviético se introdujo el concepto de fondos y documentos de archivo especialmente valiosos. Crearon un fondo de seguro en microfilm, así como un fondo de uso. Sin embargo, hoy en día estos documentos prácticamente no tienen demanda. Es decir, los criterios para el valor y la demanda de documentos de la era soviética no funcionan en absoluto ahora. La demanda cambia constantemente. Es casi imposible determinar con certeza qué documentos tendrán más demanda.

El aspecto técnico del problema también es importante. Por ejemplo, había una gran demanda de recopilar sus propios pedigríes. Es bueno y necesario. Comenzaron a ordenar activamente estos casos: registros parroquiales, cuentos de revisión. Pero no están adaptados en absoluto para tal uso masivo. Escanearlos como los más populares es una tontería. De un libro de 80 cm de grosor, una persona necesita solo una página. Y para satisfacer esta demanda, debe escanear las mil páginas completas. Sí, incluso con facturación. Pero, por otro lado, si estos documentos son escaneados, entonces los originales quedan fuera de circulación y se garantiza su seguridad física. Todos son únicos. Y lo más importante, los desafortunados custodios (incluidas muchas mujeres) no llevarán todas estas toneladas de papeles en sus brazos.

Sin embargo, aquí nos topamos con la forma de aportar información. Después de todo, era mucho más interesante para el usuario obtener no una imagen, sino un descifrado y una base de datos. Y la variedad de estos documentos es enorme. Solo en RGADA en el fondo 350 "Libros de Landratsky y libros de revisión" - más de cinco mil casos, alrededor de 3 millones de páginas ¿Cuántas personas deben participar? En Perm encontraron una buena salida: atrajeron fondos que se destinaron a generar puestos de trabajo. El trabajo lo hacía la gente en casa. Resolvió con éxito el problema del desempleo. Y al final, lograron hacer lo que nadie más en Rusia, en mi memoria, pudo hacer.

La experiencia de escaneo en los archivos federales nos permite sacar dos conclusiones. Primero, crear un fondo de uso electrónico sin crear una NSA es una ocupación improductiva. Resulta una enorme pila de escaneos, donde es imposible encontrar el correcto. En segundo lugar, el escaneo, especialmente el escaneo masivo, es conveniente para exponer complejos completos: fondos o inventarios. Al mismo tiempo, los casos deben escanearse en su totalidad para evitar conflictos en caso de errores en la numeración. EN casos individuales, debido a la singularidad y trascendencia de los documentos, independientemente de si hay algún texto en el reverso de la hoja o no, es necesario digitalizar la hoja, incluido el reverso. Entonces desaparece la pregunta de que es posible que hayamos escondido algo.

Hay un problema con la elección del equipo. En algún lugar necesita un escáner simple, en algún lugar debería ser más complicado. Por ejemplo, para la digitalización de los libros de Landrat, se ordenó especialmente una "cuna profunda". De lo contrario, no copie, porque el grosor del lomo de algunos libros alcanza los 80 cm.

PC Week: ¿Cuál es el principal objetivo de la digitalización en el momento actual?

ES ÉL. Hay tres de ellos. El primero es la ampliación y simplificación del acceso a los documentos del Fondo de Archivo. El segundo es garantizar la seguridad de los originales retirándolos de circulación y brindando acceso al fondo electrónico de uso. El tercero es la simplificación de la prestación de los servicios públicos. Ahora hay muchas solicitudes individuales de ciudadanos para documentos sobre el personal. Los archivos también están comenzando a digitalizarlos y usar copias electrónicas para preparar las respuestas, lo que agiliza mucho el trabajo.

PC Week: ¿Cómo digitalizan los archivos los documentos?

ES ÉL. El proceso es diferente: en algún lugar lo hacen ellos mismos, utilizando medios improvisados ​​o adquiriendo una variedad de equipos. La segunda forma es involucrar a organizaciones externas. Pero aún así, aún no hay una respuesta inequívoca a la pregunta más importante: ¿qué buscamos con la digitalización de documentos?

PC Week: ¿Y nadie les pregunta?

ES ÉL.¿Por qué?, todos preguntan. Pero, ¿cómo encontrar la única respuesta correcta? Por supuesto, la ventaja de usar documentos digitalizados es obvia. Esto y la seguridad, el acceso remoto, la facilidad de proporcionar información y la facilidad de hacer copias: una gama completa de ventajas. Otra cosa es ¿cómo lograr esto? Aquí usted es un usuario, ingresó al sitio y determinó que los documentos que necesita están almacenados. Digamos en Perm. Fuimos al sitio por el enlace, encontramos descripciones de casos. Hay un asunto interesante. ¿Y cómo conseguirlo? Bueno, si ya está digitalizado. ¿Y si no? ¿Ir al archivo usted mismo y pedir los originales? ¿O debería el archivo digitalizar todos los casos? Pero esto es imposible. Entonces, de hecho, solo queda una opción. Creación en cada archivo de la posibilidad de producción puntual de copias electrónicas a petición del usuario. Y no tiene que ser su propia unidad. También podría ser externalización. Pero dicho servicio debe proporcionarse con prontitud. Pero hacer estas copias, como muestra la experiencia, solo tiene sentido cuando ya hay sistema electrónico, lo que permitirá una colocación estructurada y de alta calidad de estos materiales. Ahí es cuando funcionará. Cuándo lo haremos y si seremos capaces de hacerlo, para ser honesto, no lo sé.

PC Week: ¿Probablemente, incluso antes de la aprobación del programa Sociedad de la Información en 2010, ya se había trabajado en la digitalización?

ES ÉL. Sí. Había proyectos separados. Por ejemplo, el Archivo Electrónico de la Comintern o una colección de documentos de la SVAG. Por regla general, se implementaron conjuntamente con socios extranjeros. Los fondos propios para su implementación no fueron suficientes. El asunto no fue fácil. Hubo dificultades técnicas, metodológicas, organizativas y tecnológicas. Pero la experiencia se ha ido acumulando. Y ahora es muy útil.

PC Week: Es decir, después de la aprobación del programa, comenzaron a determinar cuáles deberían ser los principales criterios para digitalizar documentos.

ES ÉL. Este programa, digamos, permitió a los archivistas llamar la atención de las autoridades sobre el hecho de que hay un problema y necesita ser resuelto. Elaborar y aprobar programas de digitalización. Y atraer financiación para ello. Pero hoy no existe un criterio universal. Es difícil definir un enfoque único para todos, porque los archivos almacenan documentación completamente diferente.

PC Week: ¿Entonces cada archivo definió los criterios en sí mismo?

ES ÉL. Actualmente, si. En principio, estos son cuatro criterios, generalmente se aceptan, pero no diré que son los más correctos. Esta es la demanda de documentos, garantizando la seguridad, facilitando el trabajo de los empleados del archivo, mejorando las condiciones de servicio al usuario. Además, agiliza el trabajo. Si tengo una NSA electrónica en mi sitio, entonces el usuario llega al archivo preparado mirando el inventario en Internet. Si los documentos requeridos ya han sido digitalizados, tiene la oportunidad de verlos en su computadora sin ir al archivo, o recibirlos en la sala de lectura sin demora.

PC Week: Resulta que cada archivo debe decidir por sí mismo qué digitalizar en primer lugar.

ES ÉL. Muy bien. Este debe ser un programa exclusivamente individual para cada archivo. No puedes hacer uno. Depende de muchos factores: de las oportunidades financieras, del grado de desarrollo e implementación de las tecnologías de la información, de la demanda específica. Entonces, alguien tiene una gran demanda de documentos sobre el personal, y es necesario satisfacer las necesidades de los ciudadanos. Aunque desde el punto de vista archivístico, estos documentos no son permanentes, sino que tienen un período de almacenamiento temporal de 75 años. Pero esto facilita el trabajo y ayuda a las personas, porque una persona no espera la respuesta a una solicitud durante un mes, sino que recibe la información requerida en dos días. Entonces, es necesario invertir en este esfuerzo y recursos.

PC Week: Al determinar las prioridades de los documentos a digitalizar, ¿los archivos los coordinan con los archivos rusos?

ES ÉL. Si hablamos de archivos regionales, entonces no. Este es el negocio de cada archivo. Nos envían sus programas de informatización y digitalización. Los conocemos y damos nuestros consejos. Los ayudamos lo mejor que podemos, asignamos fondos del FTP. Otra cosa son los archivos federales. Aquí la posición del Archivo Ruso tiene una importancia decisiva. Pero incluso aquí no hay un criterio universal. Para satisfacer la demanda cada vez mayor de información genealógica, el Archivo Ruso ha asignado más de 40 millones de rublos. para la transferencia de libros landrat almacenados en RGADA a formato electrónico. Respondiendo al constante interés de la sociedad por la historia de nuestra patria en el pasado reciente, en junio de este año se inauguró el sitio “Documentos de la era soviética”, donde se muestran imágenes de documentos del fondo personal de I.V. Stalin y del Politburó de el Comité Central están publicados. Se prepararon proyectos de Internet dedicados al 1150 aniversario Estado ruso, 400 aniversario del fin de los disturbios, 200 aniversario guerra patriótica 1812. Naturalmente, allí se publicaron imágenes de los documentos más importantes y populares.

PC Week: ¿Entonces ahora solo se emitirán copias electrónicas en la sala de lectura del archivo, y no documentos originales?

ES ÉL. Idealmente, necesita que una persona encuentre el documento que está buscando en el sitio, solicite un caso y se le entregarán los documentos escaneados. Y el original permanece intacto. Sin embargo, hay casos en los que necesita ver el original. Por ejemplo, no importa cuán buena sea la técnica, no transmitirá marcas de agua. Y en ellos puede establecer la fecha del documento. Pero esos casos son uno entre mil.

PC Week: resulta que el archivo se proporcionó al usuario servicio público, pero después de que se deba guardar la copia digitalizada del documento?

ES ÉL. Por supuesto, esta es la ventaja de escanear. Antes había microfilmes, xerox, mecanografiados. Y el archivista, habiendo hecho copias, se las dio al usuario. Es decir, no tenía copia del documento. En el caso de la digitalización, queda una copia. Pero para ello debe estar claramente definido el lugar de almacenamiento. Y si posteriormente hay una segunda solicitud, no habrá necesidad de plantear el caso. Necesita adquirir experiencia en este tipo de trabajo.

PC Week: ¿Cómo se determinan los plazos para digitalizar matrices de documentos?

ES ÉL. Los plazos dependen de tres razones: de las posibilidades técnicas y financieras y del estado de los documentos. Hay documentos que están encuadernados de tal manera que incluso la tecnología más moderna no puede obtener el texto completo. Es decir, habrá que bordarlos, cosa que no gusta mucho ni a los documentos ni a los archiveros. Escanear. Luego coser hacia atrás. Toma tiempo. Además, los plazos dependen del volumen de casos, de la cantidad de hojas en ellos. No es tan difícil escanear una pila de papeles en un formato estándar, pero una tarjeta de 3x8 m ya lo es más. Según los documentos contables, esta es una hoja. Pero se escanea solo en partes. Y luego, en el software, debe "coserlo" todo, ajustarlo y ver cómo se verá este documento.

PC Week: ¿Cómo es el trabajo sobre la implementación del punto 89 del programa objetivo federal "Cultura de Rusia (2012-2018): formación de recursos electrónicos de archivo y su provisión en Internet"?

ES ÉL. Como parte de la implementación de este ítem, se está digitalizando el inventario. También se están digitalizando documentos, incluidos los libros de landrat. Además, también estamos tratando de ayudar a las regiones: incluimos alrededor de cinco o seis regiones al año en este programa y asignamos de 10 a 15 millones de rublos. Creamos exposiciones en línea, etc. En total, se asignan 67 millones de rublos por año para la implementación del trabajo bajo este programa.

PC Week: ¿La distribución de fondos depende del grado de importancia y trascendencia de los documentos?

ES ÉL. Sí. Los archivos presentan solicitudes en una forma determinada para la participación, consideramos estas solicitudes. También se aplican firmas que creen que ofrecen cosas interesantes. Los consideramos, elegimos soluciones prometedoras interesantes, elaboramos un plan general y realizamos compras en base competitiva. El año pasado hubo 52 contratos estatales para este evento. Es decir, cada semana firmábamos un contrato.

PC Week: Usted tocó el tema de los documentos ya almacenados en los archivos, a partir del siglo XI, pero también están llegando nuevos documentos en papel a los archivos y esta es una gran variedad. ¿Cómo se trabaja con ellos? ¿Cómo se resuelve el tema de su digitalización?

ES ÉL. Para nosotros, solo una cosa es importante: si estos documentos pertenecen o no a la composición del fondo de archivo. Es decir, están sujetos a una vida útil permanente o no. Y luego, desde el punto de vista del uso, da igual que se trate de documentos del siglo XI o del XXI. En este sentido, son iguales. Otra cosa es que naturalmente tenemos un fondo de seguro y un fondo para uso de documentos del siglo XI. Y estos documentos únicos rara vez se entregan. Existe un Registro Estatal especial de documentos únicos de la Federación Rusa, que se publica en el sitio web del Archivo Federal y contiene sus descripciones e imágenes electrónicas.

PC Week: En este sentido, ¿es más fácil aceptar para el almacenamiento documentos traducidos a formato electrónico? Por ejemplo, han entrado en vigor cambios en la legislación relativa a la documentación del personal, y los archivos, probablemente, ¿pueden aceptarla en formato electrónico?

ES ÉL. Supongo que si. Pero tiene poco sentido que el archivo estatal tome documentos contemporáneos actualmente sin personal. ¿Para qué? ¿Calcular tu pensión? Hay Fondo de pensiones, que ha establecido un registro especializado de ciudadanos, desde el año 2000.

PC Week: ¿Entonces los archivos no aceptan registros que tengan 75 años?

ES ÉL. No, lo hemos guardado durante mucho tiempo. Y ahora estamos negociando activamente con el mismo Fondo de Pensiones, para que podamos reducir este período para los documentos en papel de 75 a 15 años. Pero el Fondo de Pensiones teme que su sistema electrónico pueda colapsar.

Y esos documentos que eventualmente nos llegarán en forma electrónica son un problema muy grande y completamente separado. Estas son preguntas sobre gestión de documentos electrónicos, documentos electronicos. Cómo tomarlos, cómo almacenarlos, es un tema aparte.

PC Week: ¿Aún no ha recibido dichos documentos?

ES ÉL. No, lo hacen. Los materiales del censo de población y del censo agropecuario fueron aceptados por GARF en formato electrónico. Otra cosa es que estos censos existen solo en formato electrónico. Pero todavía no hay una aceptación masiva de la documentación comercial. Hay bastantes problemas sin resolver aquí.

PC Week: ¿Y los documentos de las organizaciones liquidadas? ¿Se aceptan para almacenamiento?

ES ÉL. Aceptamos. Es cierto que, en caso de quiebra y liquidación de una empresa, los síndicos de la quiebra están obligados a encontrar dinero para describir los documentos de las organizaciones liquidadas, pero no siempre lo encuentran.

PC Week: Los Archivos Federales administran 15 archivos federales. archivos regionales en este momento eliminado del control de su departamento?

ES ÉL. Sí, no hay control directo sobre ellos. ellos obedecen órganos ejecutivos sujetos de la federación. En algún lugar estos son servicios de archivo independientes. En algún lugar ellos, como nosotros, están incluidos en los ministerios de cultura. En algún lugar, al Ministerio de Justicia o directamente a la oficina del gobernador. Pero la verticalidad del poder que existió en la Unión Soviética y duró hasta 2004, lamentablemente ya no existe. Siempre y cuando mantengamos la unidad metodológica. ¿Cómo podemos ayudar a los archivos regionales? Representantes de los Archivos Federales participan en los eventos anuales que se realizan en cada Distrito Federal consejos científicos y metodológicos. Una vez al año se realiza el Consejo Archivístico, donde se reúnen archiveros de todo el país. Es decir, las conexiones permanecen. Bromeamos diciendo que un archivista es una profesión en la que en cualquier ciudad puedes encontrarte sin dinero y cosas, acude a otros archivistas y te aceptarán, te alimentarán y te enviarán a casa. Hay una hermandad que, de hecho, no es propia de ninguna otra profesión.

PC Week: Gracias por la charla.

En la oficina, a menudo es necesario enviar copias por correo electrónico: versiones electrónicas de documentos impresos. Estos pueden ser varios actos, facturas, cartas, contratos, cartas, notas de oficina y cualquier otro documento posible.

En casa tenemos fotografías antiguas que se han vuelto decrépitas con el paso de los años y nos gustaría conservarlas.

Nos dieron un libro interesante por un tiempo, pero queremos tenerlo con nosotros. ¿Cómo hacerlo todo? Nuestros documentos en papel de corta duración deben convertirse a formato electrónico, es decir, digitalizarse y almacenarse.

La digitalización es la conversión de una imagen o una señal analógica de audio/video a un formato digital adecuado para su grabación en medios electrónicos.

Para digitalizar imágenes de un objeto, existen dispositivos especiales: escáneres. Hay escáneres de códigos de barras, escáneres de película. Los escáneres biométricos leen el patrón de la retina del ojo o el patrón papilar de la piel de los dedos. La forma de un objeto tridimensional es leída por un escáner 3D tridimensional.

En escáneres para procesar soportes en papel - dibujos, fotografías, documentos de texto, la imagen se ilumina línea por línea con una lámpara especial y el flujo de luz reflejado se enfoca en una matriz fotosensible. El convertidor de analógico a digital convierte las señales eléctricas recibidas en un sistema de datos binarios, que forma una copia digital de la imagen.

La elección de un escáner depende de las tareas y detalles de su aplicación. Casi siempre se utiliza un escáner en una oficina para digitalizar documentos. Incluso si las fotografías se escanean, no están sujetas a requisitos de alta calidad en la oficina. Una resolución de 300 dpi es suficiente para garantizar el funcionamiento preciso de los programas de reconocimiento y obtener una buena texto legible. Cualquier escáner producido en la actualidad proporciona una resolución aceptable para el trabajo de oficina.

Esto también se aplica a la profundidad de color. Casi todos los escáneres modernos reproducen el nivel de color gris requerido para los documentos impresos.

Es importante en la oficina, donde la tarea principal es digitalizar rápidamente página por página documentos de texto, esta es la automatización del proceso de escaneo. Se pueden utilizar escáneres alimentados por hojas. Aquí, se inserta una hoja de documento en la ranura de la máquina y se tira, como en una máquina de fax, a lo largo de los rodillos guía. Tal escáner es conveniente con un alimentador automático de hojas incorporado. Cargamos varias hojas de un documento de varias páginas en la bandeja y, mientras el escáner digitaliza, al mismo tiempo estamos haciendo otra cosa. Todo es simple aquí. Si está instalado el software de OCR apropiado, basta con presionar un solo botón para digitalizar y guardar un documento en el formato deseado en dicho escáner.

Una solución de oficina moderna para un departamento de una empresa de ingeniería, por ejemplo, podría ser un escáner A3 incluido en un dispositivo multifuncional junto con una impresora A3/A4. En tal MFP es conveniente digitalizar y hacer copias de dibujos.

Está claro que no funcionará escanear una revista encuadernada o una extensión de un libro en un escáner de alimentación de hojas.

Para escanear documentos de dos caras, existen escáneres dúplex, donde dos elementos de escaneo procesan ambos lados de la hoja en una sola pasada.

Una buena solución para el hogar es una impresora multifunción de inyección de tinta en color. El MFP es un dispositivo multifuncional que incluye un escáner y una impresora. Tal dispositivo es también una copiadora. Es decir, la impresora multifunción puede escanear automáticamente un documento e imprimir una copia del mismo: crear una fotocopia del documento.

El dispositivo compacto con funciones combinadas ocupa menos espacio en la mesa. Su costo será significativamente menor que el costo total de los dispositivos incluidos en él, si los compra por separado. En una impresora de inyección de tinta a color, hacemos fotografías y tarjetas de presentación a color de alta calidad, y con un escáner plano digitalizamos documentos, álbumes de fotos o libros necesarios.

En las siguientes lecciones, aprenderemos cómo digitalizar, convertir y guardar manualmente documentos de texto en un escáner de superficie plana, página por página.

En estos ejemplos, utilicé un MFP de escritorio A4 popular para escanear. Un dispositivo tan económico es la mejor solución para el hogar y puede ser una segunda impresora multifunción adicional en la oficina.

Supongamos que tenemos una multipágina lógicamente documento relacionado, que debe ser digitalizado y enviado por correo electrónico a nuestra contraparte. Llamémoslo "Contrato".

En nuestro querido Windows XP, hay un "Asistente para escáner o cámara digital" estándar. Para que el asistente funcione, el escáner debe estar instalado en la computadora y debe estar habilitado. Trabajar en el asistente es muy simple y hay una pequeña guía en la lección Digitalización de documentos en Windows XP.

En Windows 7, la herramienta para crear copias electrónicas de imágenes y documentos impresos es el componente estándar de fax y escaneo de Windows.

Entonces, leímos las lecciones y con la ayuda de uno de estos programas recibimos archivos de escaneo de las páginas de nuestro contrato en uno de formatos gráficos, guardado, y adjúntelos a un correo electrónico, envíelo a la dirección.

Lo malo aquí es que al escanear un documento de varias páginas con estos programas, no podremos combinar escaneos de páginas en un solo archivo. Por supuesto, puede numerar los archivos de página en orden y comprimirlos para poder enviarlos de forma compacta. Pero nuestro destinatario solo podrá visualizar las páginas de turno en un editor gráfico, sin poder navegar por el documento. Es incómodo y una pérdida de tiempo. Y en general inaceptable.

De hecho, con estas herramientas obtenemos fotografías digitales individuales de las páginas de un documento.

Para convertir nuestros escaneos dispersos a documento único con la posibilidad de búsqueda de texto completo, necesita un programa de reconocimiento de texto. Lo mejor por hoy es FineReader.

FineReader es un programa empresa rusa ABBYY. La última versión 12 de ABBYY FineReader se lanzó en febrero de 2014. Este programa extrae datos de texto de imágenes digitales: reconoce caracteres de texto. La versión de evaluación de ABBYY FineReader 12 Professional se puede descargar del recurso oficial: http://www.abbyy.ru/finereader y entrenar durante 30 días.

Es mejor cuando una de las últimas versiones pro está instalada en la computadora. Aquí y más abajo, se describe el trabajo en ABBYY FineReader 10 Professional Edition.

Entonces, en las lecciones anteriores, escaneamos las páginas con las herramientas estándar de Windows, las numeramos, las guardamos con la extensión "jpg" y las colocamos en una carpeta separada, a la que llamamos "Acuerdo".

Entonces, usando las maravillosas funciones del programa de reconocimiento, podemos convertir fácilmente varias imágenes en formatos editables.

Más sobre esto, por favor, en la siguiente lección: Escaneo en ABBYY FineReader.

Y así, leemos estas lecciones y vemos qué ventajas nos da el programa de reconocimiento. En lugar de la tediosa y laboriosa tipificación de un libro o folleto, simplemente escaneamos las páginas necesarias con FineReader, las editamos si es necesario y las guardamos en el formato seleccionado. De este modo, puede redactar rápidamente, por ejemplo, un artículo o un resumen. .

Y cómo escanear las páginas de los libros y digitalizar los libros que leemos en el tema: Digitalización de un libro.

En conclusión, resumamos el tema: un escáner en combinación con un programa de reconocimiento es un reemplazo racional para escribir desde el teclado. Tener una versión en papel: un texto impreso en una impresora o en una imprenta, en lugar de ingresar desde el teclado, simplemente lo escaneamos. Otra área popular de aplicación del escáner es la digitalización de una variedad de productos impresos: etiquetas, postales, fotografías, revistas, libros.

La digitalización de documentos es la conversión de documentos a formato digital. Puede digitalizar dibujos, textos y libros. La actividad de cualquier oficina o institución promedio, tarde o temprano lleva a la formación dentro de sus muros enorme cantidad documentos. Los documentos se almacenan en estanterías y cajones de escritorio. Ocupan una gran cantidad de espacio en los armarios de oficina y en los escritorios de los empleados de oficina. Montañas de documentación, que es muy difícil de entender, y es casi imposible encontrar rápidamente uno u otro documento. Para que la oficina no se convierta en un depósito de archivos de documentos, y sus empleados puedan trabajar rápidamente con cualquier documentacion necesaria, necesita digitalizar todos los documentos disponibles en la empresa y pasarlos de papel a formato electrónico, utilizando los servicios de escaneo y reconocimiento de documentos. Los documentos electrónicos son mucho más fáciles de procesar y almacenar. No ocupan mucho espacio en la oficina. No se pueden perder ni estropear, y encontrar un documento en un archivo electrónico digitalizado, donde todo está sistematizado y ordenado en fajos, es mucho más fácil que en una enorme pila de papeles guardados en un armario de oficina. Los documentos digitalizados también son convenientes para usar en el caso de que un empleado de la empresa se vaya de viaje de negocios o para negociaciones. Una pequeña unidad flash en su bolsillo puede acomodar todo el archivo de los documentos de la empresa y le dará la oportunidad, si es necesario, de encontrar rápidamente cualquier documento necesario. Es muy conveniente y práctico usar documentos digitalizados, mientras que los servicios de digitalización de documentos no son lo suficientemente costosos y están disponibles no solo para grandes corporaciones, sino también para pequeñas empresas y organizaciones presupuestarias.

Digitalización de dibujos

La digitalización de dibujos, o como también se le llama vectorización, te permite pasar dibujos técnicos y arquitectónicos del papel al formato electrónico. Los servicios de digitalización de dibujos pueden simplificar y sistematizar significativamente el sistema de almacenamiento de archivos de la documentación de diseño, y son muy relevantes para ambos empresas industriales e institutos científicos, así como para oficinas de arquitectura y diseño, arquitectos particulares, estudiantes y todos aquellos que, de acuerdo con las especificidades de su trabajo o estudio, trabajen con dibujos. Por regla general, el principal problema del archivo de la documentación de diseño es la búsqueda del dibujo deseado, las condiciones en las que se debe almacenar el dibujo impreso en papel Whatman y su voluminosidad. La digitalización de dibujos puede resolver eficazmente estos problemas. Cuando un dibujo, gracias a la digitalización, se transfiere de portador de papel en formato electrónico, para su almacenamiento no es necesario contar con grandes áreas de archivo, sino que basta con una pequeña cantidad de espacio libre en el disco duro de una computadora o cualquier otro medio electrónico. Al mismo tiempo, basta con sistematizar los contenidos del archivo una vez, descomponiendo los dibujos digitalizados en carpetas temáticas, y luego es fácil encontrar cualquier dibujo necesario. Los dibujos almacenados en el archivo electrónico no están sujetos a esfuerzos mecánicos ni a la influencia de otras fuerzas y elementos naturales. No se pueden mojar, rasgar o perder, y gracias al sistema de respaldo, puedes protegerte al cien por cien de su extravío o extravío. Trabajar con dibujos digitalizados es mucho más fácil que con sus contrapartes en papel. Es mucho más conveniente llevar un disco láser con usted, en el que siempre tiene acceso a todo el archivo, en lugar de volúmenes de papeles grandes y dibujos inconvenientes. Sí, y muestre el dibujo al cliente, donde es más conveniente en el monitor de una computadora o computadora portátil, pero sin desplegar papel de dibujo de varios metros sobre su mesa. Sin mencionar que el dibujo digitalizado simplemente puede enviarse a través de Email, mientras ahorra tanto su tiempo como el tiempo de aquel a quien estaba destinado este dibujo. Hoy en día, muchas empresas brindan servicios para digitalizar dibujos y nos complace afirmar que nuestra empresa es una de las líderes en el campo de la digitalización de documentos. A la fecha, contamos con todos los equipos y programas necesarios para asegurar la digitalización de cualquier dibujo preservando al máximo su calidad.

Digitalización de textos

La digitalización de textos es un método para convertir texto impreso de papel a formato electrónico. La digitalización de textos es indispensable como herramienta conveniente para crear archivos electrónicos y como herramienta para convertir libros y libros de texto a formato electrónico. Ahora los amantes de la palabra literaria no tienen que sentarse durante horas en bibliotecas o cargar con un libro pesado e incómodo. Basta con tener una tableta electrónica que pueda caber fácilmente en su bolsillo o bolso, y leer cualquier ficción o literatura de referencia.

digitalización de libros

La digitalización de texto le permite transferir un libro de cualquier tamaño a formato digital. Es muy conveniente y práctico. Además de la facilidad de uso, cabe mencionar los evidentes beneficios económicos. Lejos de siempre, puede comprar este o aquel libro de texto o libro para usted mismo, y al mismo tiempo puede tomarlo prestado de la biblioteca o de un amigo, y gracias al servicio de digitalización, convertirse en propietario de la versión electrónica, gastando mucho menos. dinero para esto que con la compra de un libro. La digitalización de libros también ha simplificado enormemente el proceso de almacenamiento de manuscritos raros y libros de valor histórico. Después de todo, el papel no es eterno, pero la versión electrónica de la palabra impresa realmente se puede almacenar durante miles de años y nunca perderá su contenido original, preservando no solo el texto, sino también las ilustraciones para la posteridad.

ESCANEAR: Tecnologías

¿Qué es la digitalización?

02.10.2015, Vie, 14:05, Msk 2707

Escaneo, retroconversión y servicios relacionados. Revisión de tecnologías para convertir documentos en formato electrónico.

Hay varias opciones para organizar los procesos de digitalización. Pueden llevarse a cabo de forma independiente o con subcontratación de servicios, con la exportación de documentos o la realización de trabajos en su territorio. Al digitalizar, se pueden utilizar escáneres de oficina, de documentos profesionales o planetarios. Los datos se pueden extraer en modo manual, semiautomático o automático, con procesamiento de archivo preliminar de documentos en papel o clasificación de información ya en formato electrónico, etc.

¿Qué camino elegir?

La solución depende de tarea específica, porque cada uno de los "o" anteriores determina la calidad del resultado y el costo del trabajo. Por ejemplo, la pregunta de los documentos encuadernados es eterna: ¿es más rentable escanear lentamente en un estado encuadernado o gastar dinero en coser, pero digitalizar rápidamente en los escáneres de documentos?

La forma más fácil de elegir el camino que funcione mejor para usted es buscar la experiencia de una organización de digitalización. Interesado en el trabajo grandes compañias Realizarán una encuesta de forma gratuita y determinarán el mejor enfoque para usted. No desaproveche esta oportunidad y no espere caer en la tentación de solicitar servicios: la mayoría de estas empresas también están interesadas en suministrar hardware y software para la digitalización por cuenta propia.

¿Cuántos documentos necesitas escanear?

El parámetro definitorio es el volumen de documentos.

El parámetro definitorio es el volumen de documentos. Para el escaneo diario de pequeños paquetes de documentos bordados (por ejemplo, contabilidad primaria), es adecuado un escáner de oficina normal, que puede soportar una carga de varios miles de páginas al día. Solo necesita complementarlo con un programa conveniente para indexar.

El escaneo regular de grandes volúmenes requiere equipo profesional. Estos son escáneres industriales que cuestan mucho dinero (este equipo es utilizado por el Servicio Federal de Impuestos, el Servicio Federal de Aduanas y los grandes bancos). Por tanto, un acuerdo marco para la prestación de servicios de digitalización periódica puede ser una alternativa menos costosa.

La conversión de matrices retrospectivas grandes a formato electrónico por su cuenta no se justifica económicamente: además de comprar equipos y capacitar a los empleados, se requerirán costos significativos de mano de obra y tiempo. Definitivamente es más eficiente ordenar un servicio, ya que una gran empresa puede destinar una gran cantidad de personal y resolver el problema rápidamente.

¿Dónde escanear documentos?

El parámetro definitorio es la demanda de documentos escaneados. ¿La incautación de documentos afecta la actividad de la organización al momento del escaneo? Esto es especialmente crítico cuando se digitalizan documentos a los que los empleados acceden regularmente, o que pueden ser solicitados repentinamente por la autoridad reguladora, así como para eliminar emergencias asociadas con los documentos. Ejemplos: financieros y documentos de personal, documentación técnica y operativa, libros de registro y otros fondos del sector.

Área de escaneo, organizada en las instalaciones de la empresa-cliente de servicios.

Si necesita digitalizarlos lo suficientemente rápido, entonces el enfoque tradicional es solicitar servicios con la partida del equipo de escaneo a su territorio. A menudo, esto resulta más barato que entregar documentos a la producción del contratista y viceversa, pero todo está determinado por la lejanía territorial. Las regulaciones del trabajo de campo significan escanear el caso emitido dentro de uno o dos días hábiles, sin una retirada prolongada del flujo de trabajo.

¿Debo bordar documentos?

Parámetros determinantes: el estado de los documentos y la posibilidad de cosido. Si existe tal oportunidad, y el papel es adecuado para tirar con un escáner de documentos, entonces debe bordarse. El hecho es que el escaneado de documentos encuadernados en un escáner planetario (libro) es varias decenas de veces más lento que la digitalización en streaming. Aumentar proporcionalmente el tiempo de trabajo y el costo de la mano de obra. Escanear en escáneres de documentos, incluso teniendo en cuenta el empalme, es más rápido y económico.

Puede bordarse usted mismo o confiarlo al artista.

Puede bordar por su cuenta o puede confiarlo al contratista: si se elige una empresa de confianza, no debe tener miedo de perder documentos. Por el contrario, la regulación estricta de todos los procesos y los materiales de alta calidad permiten a las empresas asegurarse contra pérdidas financieras adicionales y daños a su imagen. Incluso se confía en este enfoque tribunales rusos: cuando se organiza el escaneado, normalmente por orden interna, se permite la unión y posterior cosido de causas judiciales.

Por cierto, las grandes empresas pueden realizar simultáneamente un procesamiento de archivo profesional: en primer lugar, parte del trabajo ya se ha realizado en preparación para el escaneo y, en segundo lugar, el procesamiento de archivo ayuda a identificar documentos no reclamados y reduce el volumen de matrices escaneadas, lo que puede reducir el costo del trabajo

¿Qué calidad elegir?

Hoy en día, cualquier objeto se puede escanear con alta calidad: desde una pequeña tarjeta de biblioteca hasta tarjetas 8A0 y escenarios teatrales.

Determinación de parámetros: tipo de documento y cantidad de recurso recibido en formulario electronico. Hoy en día, los equipos de escaneo pueden producir imágenes con resoluciones que van de 200 a 1200 puntos por pulgada (dpi). Para obras artísticas se suele utilizar una resolución de 400-600 dpi, lo que te permite crear reproducciones de gran calidad. Más alta calidad se usa solo cuando es necesario ampliar la imagen y detallar objetos pequeños, como monedas.

Los dibujos detallados y de bajo contraste, a menudo realizados en papel de calco y azul, deben escanearse a una resolución de 300-400 ppp y un procesamiento de imagen adicional en editores gráficos. El resto de documentos se suelen escanear a 300 ppp, que es suficiente para imprimir copias sin perder calidad. El recorte de imágenes necesario, la corrección geométrica, la corrección de color, la conversión a formatos pdf, tiff, jpeg, etc. se pueden realizar de forma totalmente automática mediante programas integrados en el equipo de escaneado o suministrados con él.

En la mayoría de los casos, se utiliza el modo de disparo en color. Esto es necesario para todos los documentos que han sido corregidos o sellados sobre el texto, para verificar que se tomó una copia electrónica del documento original con un sello y una firma, así como para la legibilidad de los textos desvaídos y para transmitir las características únicas de el original. No se discute la necesidad de escanear en color las obras artísticas. El modo "escala de grises" se usa solo en algunos casos: cuando los documentos no contienen atributos de color, o cuando es necesario reducir el volumen del recurso electrónico recibido.

El escaneo se puede realizar de forma independiente. La tarea principal es capacitar a los empleados para que trabajen correctamente con equipos complejos, ya que la calidad de las imágenes resultantes es importante para la indexación posterior: un documento mal escaneado, sombras, destellos y otros defectos en una imagen electrónica pueden hacer que la información importante sea ilegible. Esto evitará que se apliquen tecnologías de extracción automática de datos y puede dar lugar a errores de indexación. Subir datos erróneos a algunos sistemas ( registros estatales, sistemas contables) no está permitido.

Indexación

El escaneo simple rara vez se usa, ya que en el trabajo posterior será solo un poco más fácil buscar información en un conjunto de archivos gráficos al voltear el papel. Para poder buscar, es necesario seleccionar varios atributos (campos de índice) en el documento.

Empleados involucrados en la indexación masiva de documentos por entrada manual.

Los atributos seleccionados se pueden agregar al nombre del archivo. Esta práctica se ha desarrollado en los tribunales rusos: para que el operador de escaneo no tenga acceso a los sistemas internos del tribunal, al digitalizar, se ingresan todos los detalles necesarios en el nombre del archivo. Posteriormente, estos datos son reconocidos por el sistema judicial al cargar cada documento por separado.

Pero normalmente los documentos digitalizados se suben a sistema de informacion grupo, lo que requiere la creación de una base de datos. Entonces, si necesita adjuntar un documento a una tarjeta ya existente en el sistema contable, basta con extraer un par de detalles que lo definen de manera única, generalmente un número y una fecha.

Si es necesario formar una base de búsqueda basada en los propios documentos, la tarea determina la cantidad de datos que se extraerán: desde un par de detalles para buscar un archivo en un archivo electrónico hasta transferir toda la información importante a un archivo analítico. base de datos (nombre completo, direcciones, TIN, KPP, fechas, números de documentos de solicitud, etc.).

Los museos, bibliotecas y archivos aplican sus propias reglas de indexación al digitalizar unidades de almacenamiento y documentos contables. Un área separada de servicios también es la vectorización, que se utiliza, en particular, en la digitalización de cintas de registro (automáticas) y dibujos (representación manual en sistemas CAD).

¿Cuántos datos extraer?La respuesta a esta pregunta también se obtiene mejor mediante la experiencia, ya que la cantidad de detalles que se extraerán depende de la tarea funcional y determina en gran medida el costo de la digitalización. En algunos casos, puede limitarse a colecciones de documentos, cuando las imágenes electrónicas se combinan bajo los auspicios del documento principal (por ejemplo, un contrato o registro de cuentas). En otros, es necesario extraer todos los datos contenidos en el documento para cumplimentar la ficha del sistema de información.

Ejemplos de recuperación de datos

Análisis de pedidos realizados en el portal zakupki.gov.ru por empresas con participación estatal e instituciones estatales (44-FZ, 223-FZ), muestra que:

- Para vincular las copias electrónicas de la ORD al sistema de gestión de documentos electrónicos, basta con el número, fecha y tipo de documento.

– El escaneo de la documentación financiera suele ir acompañado de la extracción del número, fecha, nombres y detalles de los pagadores, montos.

– La digitalización de documentos de archivo de municipios (decretos de administraciones, comités ejecutivos de la ciudad, consejos de aldea, etc.) con el fin de proporcionar servicios e inventariar objetos de tierras y relaciones de propiedad requiere extraer el número y la fecha del documento, todos los nombres completos y direcciones . Además, las direcciones deben compararse con los directorios actuales de KLADR/FIAS.

– La digitalización de los documentos del Fondo de Archivos de la Federación Rusa va acompañada del llenado estricto de la NSA y la descripción de los fondos de acuerdo con la legislación de archivos.

– La indexación de inventarios y registros implica el reconocimiento de todos los registros ordinales.

– Para trabajar con dibujos en forma electrónica, es necesario extraer casi todos los campos del sello.

– Escanear archivos compuestos requiere no solo extraer los detalles de cada documento, sino también establecer relaciones. El caso más difícil es la documentación de diseño, donde la base de datos generada tiene una jerarquía de varios niveles y enlaces de documentos.