Digitalizarea documentelor de arhivă probleme tehnice și tehnologice. Cum să vă digitalizați documentele

Digitalizarea arhivelor de hârtie include scanarea și catalogarea documentelor. Cu cât este mai mare organizația, compania, cu atât fluxul documentar este mai complex, cu atât mai multe documente sunt stocate în arhivele sale și, în consecință, serviciile de digitizare a arhivelor arată mai atractive.

Economii la căutare

  1. Adesea pentru arhivare documentul solicitat este nevoie de mult timp și efort. Sau poate apărea o situație când același document este cerut de mai mulți angajați deodată - în acest caz, trebuie să faceți o copie a acestuia.
  2. În plus, este de remarcat faptul că accesul frecvent la documentele pe hârtie, mai devreme sau mai târziu, duce la deteriorarea acestora și, uneori, la „pierdere”, dacă fișierele sunt plasate în mod eronat în arhivă.
  3. Dar pentru a rezolva toate aceste probleme este destul de simplu - trebuie doar să asigurați digitizarea arhivelor pe hârtie, să utilizați sisteme informatice automatizate în munca dvs. care vă vor oferi căutare promptă, precum și acces la copiile electronice ale documentelor.
  4. Digitalizarea arhivelor de hârtie are multe avantaje. Și vorbim nu numai despre noi oportunități calitativ pentru furnizarea și utilizarea documentației companiei, ci și despre asigurarea siguranței acestor informații.

Avantajele documentelor digitizate:

  • reducerea încărcăturii pe arhiva hârtiei și zona de fotocopiere;
  • posibilitatea eliberării spațiului arhivistic;
  • reducerea costurilor de întreținere a arhivelor pe hârtie.

Digitalizarea arhivelor de hârtie: etape

Primul stagiu. Toate lucrările de digitizare a arhivelor începe cu examinarea documentelor. În urma analizei documentelor, se determină structura matricei de hârtie, precum și cantitativă și caracteristici de calitate documente. Pe baza rezultatelor examinării, alegerea tehnologiei și digitizarea documentelor, criteriile de evaluare a calității, alegerea compoziției echipamentelor se realizează, se convine termenele de execuție și bugetul.

Faza a doua este o scanare directă. Digitalizarea arhivelor este procesul de creare a imaginilor grafice ale unui document folosind scanere. Înainte de a traduce un document în formular electronic, operatorul va selecta modul optim de scanare, va efectua, de fapt, scanarea, controlând în același timp calitatea imaginilor rezultate pe monitor.

Efectul introducerii arhivei electronice

Rezultatul digitizării arhivelor pe hârtie sunt copiile electronice ale documentelor. Echipamentul profesional pe care îl folosește compania noastră vă permite să scanați diverse documente la viteze de până la câteva mii de pagini pe zi - în modul lot. Fișierele rezultate sunt scrise pe unități flash, CD-uri, DVD-uri și alte medii.

Rezultatele digitizării arhivării

Imediat după finalizarea digitizării arhivelor, imaginile grafice sunt supuse procesării automate - împărțirea în pagini de extensii, tăierea de-a lungul marginilor, alinierea prin linii, eliminarea zgomotului, îmbunătățirea calității imaginii și așa mai departe. Puteți seta parametrii pentru catalogarea documentelor scanate la discreția dvs., asigurând astfel optimizarea proceselor de afaceri din partea managementului documentelor.

La birou, se întâmplă adesea să ai nevoie să trimiți e-mail copii - versiuni electronice ale documentelor tipărite. Acestea pot fi diverse acte, facturi, scrisori, contracte, charte, note de birouși orice alte documente posibile.

Acasă avem fotografii vechi care au devenit decrepite de-a lungul anilor și am dori să le păstrăm.

Ni s-a oferit o carte interesantă de ceva vreme, dar vrem să o avem cu noi. Cum să faci totul? Documentele noastre pe hârtie de scurtă durată trebuie convertite în formă electronică, adică digitalizate și stocate.

Digitalizarea este conversia unei imagini sau a unui semnal audio/video analogic într-un format digital adecvat pentru înregistrarea pe suport electronic.

Pentru a digitiza imaginile unui obiect, există dispozitive speciale - scanere. Există scanere de coduri de bare, scanere de film. Scanerele biometrice citesc modelul retinei ochiului sau modelul papilar al pielii degetelor. Forma unui obiect tridimensional este citită de un scaner 3D tridimensional.

În scanere pentru prelucrare suport de hârtie- desene, fotografii, documente text, imaginea este iluminată linie cu linie cu o lampă specială, iar fluxul de lumină reflectat este focalizat pe o matrice fotosensibilă. Convertorul analog-digital convertește semnalele electrice primite într-un sistem de date binar, care formează o copie digitală a imaginii.

Alegerea unui scaner depinde de sarcinile și specificul aplicării acestuia. Un scanner dintr-un birou este aproape întotdeauna folosit pentru a digitiza documente. Chiar dacă fotografiile sunt scanate, acestea nu sunt supuse unor cerințe de înaltă calitate în birou. O rezoluție de 300 dpi este suficientă pentru a asigura funcționarea corectă a programelor de recunoaștere și pentru a obține text lizibil. Orice scaner produs astăzi oferă o rezoluție acceptabilă pentru munca de birou.

Acest lucru se aplică și profunzimii culorii. Aproape fiecare scaner modern reproduce nivelul de culoare gri necesar documentelor tipărite.

Este important la birou, unde sarcina principală este digitizarea rapidă pagină cu pagină a documentelor text, aceasta este automatizarea procesului de scanare. Se pot folosi scanere cu alimentare cu coli. Aici, o coală de document este introdusă în fanta aparatului și trasă, ca într-un aparat de fax, de-a lungul rolelor de ghidare. Un astfel de scaner este convenabil cu un alimentator automat de coli încorporat. Încărcăm mai multe coli dintr-un document cu mai multe pagini în tavă și, în timp ce scanerul se digitalizează, facem simultan și altceva. Totul este simplu aici. Dacă este instalat software-ul OCR corespunzător, o singură apăsare de buton este suficientă pentru a digitiza și salva un document în formatul dorit pe un astfel de scaner.

O soluție modernă de birou pentru un departament al unei companii de inginerie, de exemplu, ar putea fi un scanner A3 inclus într-un dispozitiv multifuncțional împreună cu o imprimantă A3/A4. Pe un astfel de MFP este convenabil să digitalizați și să faceți copii ale desenelor.

Este clar că nu va funcționa să scanezi o revistă legată sau o întindere a unei cărți pe un scaner cu alimentare cu coli.

Pentru a scana documente față-verso, există scanere duplex, în care două elemente de scanare procesează ambele părți ale foii într-o singură trecere.

O soluție bună pentru casă este un MFP cu jet de cerneală color. MFP este un dispozitiv multifuncțional care include un scanner și o imprimantă. Un astfel de dispozitiv este și un copiator. Adică, MFP poate scana automat un document și poate imprima o copie a acestuia - creați o fotocopie a documentului.

Dispozitivul compact cu funcții combinate ocupă mai puțin spațiu pe masă. Costul acestuia va fi semnificativ mai mic decât costul total al dispozitivelor incluse în el, dacă le cumpărați separat. Pe o imprimantă color cu jet de cerneală realizăm fotografii color și cărți de vizită de înaltă calitate, iar cu un scaner plat digitalizăm documente, albume foto sau cărți necesare.

În lecțiile următoare, vom învăța cum să digitalizăm, convertim și salvam manual pe un scaner plat. documente text.

În aceste exemple, am folosit un MFP pentru desktop A4 popular pentru scanare. Un astfel de dispozitiv ieftin este cea mai bună soluție pentru casă și poate fi un al doilea MFP suplimentar la birou.

Să presupunem că avem mai multe pagini în mod logic document aferent, care trebuie digitizat și trimis prin e-mail către contrapartida noastră. Să-i spunem „Contract”.

În iubitul nostru Windows XP, există un „Asistent scaner sau cameră digitală” standard. Pentru ca expertul să funcționeze, scanerul trebuie să fie instalat pe computer și trebuie să fie activat. Lucrul în vrăjitor este foarte simplu și există un mic ghid în lecția Digitalizarea documentelor în Windows XP.

În Windows 7, instrumentul pentru crearea de copii electronice ale documentelor și imaginilor tipărite este componenta standard Windows Fax and Scan.

Deci, am citit lecțiile și cu ajutorul unuia dintre aceste programe am primit fișiere scanate ale paginilor contractului nostru într-una din formate grafice, salvate și atașați-le la un e-mail, trimiteți-le la adresa.

Lucrul rău aici este că atunci când scanăm un document cu mai multe pagini cu aceste programe, nu vom putea combina scanările de pagini într-un singur fișier. Bineînțeles, puteți numerota fișierele de pagină în ordine și arhivați-le astfel încât să le puteți trimite compact. Dar destinatarul nostru va putea vizualiza paginile pe rând doar într-un editor grafic, fără a putea naviga prin document. Este incomod și pierde timpul. Și în general inacceptabil.

De fapt, folosind aceste instrumente, obținem fotografii digitale individuale ale paginilor unui document.

Pentru a converti scanările noastre împrăștiate în un singur document cu posibilitatea de căutare full-text, aveți nevoie de un program de recunoaștere a textului. Cel mai bun pentru astăzi este FineReader.

FineReader este un program firma ruseasca ABBYY. Cea mai recentă versiune ABBYY FineReader 12 a fost lansată în februarie 2014. Acest program extrage date text din imagini digitale - recunoaște caracterele text. Versiunea de evaluare a ABBYY FineReader 12 Professional poate fi descărcată din resursa oficială: http://www.abbyy.ru/finereaderși antrenează-te timp de 30 de zile.

Este mai bine când una dintre cele mai recente versiuni pro este instalată pe computer. Aici și mai jos, este descrisă lucrul în ABBYY FineReader 10 Professional Edition.

Așadar, în lecțiile anterioare, am scanat paginile cu instrumente standard Windows, le-am numerotat, le-am salvat cu extensia „jpg” și le-am plasat într-un folder separat, pe care l-am numit „Acord”.

Deci, folosind funcțiile minunate ale programului de recunoaștere, putem converti cu ușurință diverse imagini în formate editabile.

Mai multe despre aceasta, vă rugăm, în următoarea lecție: Scanarea în ABBYY FineReader.

Și așa, citim aceste lecții și vedem ce avantaje ne oferă programul de recunoaștere. În loc de tastarea plictisitoare și consumatoare de timp dintr-o carte sau broșură, pur și simplu scanăm paginile necesare cu FineReader, le edităm dacă este necesar și le salvăm în formatul selectat. Astfel, puteți compune rapid, de exemplu, un articol sau un rezumat .

Și cum să scanăm paginile cărților și să digitizăm cărțile citim în subiectul: Digitizing a book.

În concluzie, să rezumam subiectul: un scaner în combinație cu un program de recunoaștere este un înlocuitor rațional pentru tastarea de la tastatură. Având o versiune pe hârtie - un text tipărit pe o imprimantă sau într-o tipografie, în loc să intrăm de la tastatură, îl scanăm pur și simplu. O altă zonă populară de aplicare a scanerului este digitizarea unei varietăți de produse tipărite - etichete, cărți poștale, fotografii, reviste, cărți.

Aveți probleme serioase cu stocarea documentelor pe hârtie? Rafturile sunt pline de dosare ridicol de umflate, iar tu cauti bucata de hartie potrivita pentru trei ore? Atunci este timpul să începeți să digitalizați documentele, ceea ce vă va face biroul sau apartamentul mai curat, iar metoda de căutare mai ușoară și mai convenabilă. Creați-vă propria bibliotecă digitală, editați, copiați și mutați fișierele digitale după cum doriți. Abilitatea de a crea documente digitale este una dintre binecuvântările civilizației. Așa că profită de asta!

Înainte de a îndrăzni să-ți digitizezi documentele, trebuie să știi că există două moduri de a le stoca - ca imagini și ca fișiere text. Stocarea imaginilor va necesita mult mai mult spațiu pe hard disk, dar puteți păstra în continuare stilul documentului original. Convertirea imaginilor scanate într-un fișier text va necesita timp suplimentar, deoarece este necesar să se efectueze procesul de recunoaștere optică a caracterelor OCR (deși, mai exact, acest nume nu este în întregime corect, deoarece vorbim despre lucrul cu informații digitale, totuși, așa cum se întâmplă adesea, termenul a prins rădăcini).

Cum să alegi un format pentru stocarea documentelor? Foarte simplu: dacă documentul original este scris de mână și este important pentru tine să-i păstrezi „caracteristica” (o scrisoare de la o persoană dragă) sau dacă documentul este, de exemplu, o operă de artă, atunci salvează-l ca imagine ( uneori, scrisul de mână recunoscut este la fel de important ca și cuvintele scrise). Un alt motiv mai prozaic pentru salvarea documentelor scrise de mână ca imagini este lipsa unei soluții software disponibile în comerț, potrivită pentru interpretarea caracterelor scrise de mână. Până acum, această tehnologie este blocată în PDA-uri și tablete, în care este implementată într-o formă ușor diferită de cea de care avem nevoie. Cu o tabletă, scrii caractere de mână, tastându-le în ordine, iar software-ul le transformă în text tastat în timp real. Recunoașterea scrisului de mână a unei singure persoane dintr-un document scanat este o chestiune de viitor.

Scanere

Indiferent dacă vă stocați documentele ca imagini sau ca fișiere text, veți avea nevoie de un scaner pentru a le digitiza. Dacă vrei să digitizezi relativ un numar mare de documente, atunci o imprimantă multifuncțională sau un scaner plat vă va fi suficient. Singurul lor dezavantaj este viteza relativ mică. Rețineți că doar modelele mai scumpe au un alimentator automat de coli pentru manipularea documentelor cu mai multe pagini.


Printre cele mai bune modele vom numi ScanSnap S1500 de la Fujitsu și ScanJet Professional 3000 de la HP. Viteza de scanare a documentelor a acestor dispozitive este în medie de 20 de pagini pe minut sau mai mult. ScanJet Professional 3000 are un mecanism de alimentare cu hârtie mai fiabil, în timp ce ScanSnap S1500 are un software mai avansat. Ambele scanere sunt în aproximativ aceeași gamă de preț, așa că alegerea vă aparține.

OCR - software

Cele mai multe scanere vin cu software pentru a implementa OCR, care este instalat pe computer. Dacă sunteți nemulțumit de software-ul însoțitor sau nu există niciunul, atunci astfel de programe sunt destul de comune și pot fi achiziționate separat. Există următoarele oferte de piață:

FineReader 9 Express de la ABBYY, 100 USD pentru obișnuit și 400 USD pentru Pro 10;
. OmniPage 17 Standard de la Nuance, 150 USD pentru versiunea obișnuită și 500 USD pentru versiunea profesională;
. Acrobat X Standard de la Adobe, 299 USD pentru versiunea obișnuită și 449 USD pentru versiunea profesională;
. PaperPort 12 Standard de la Nuance costă 100 USD pentru versiunea obișnuită și 200 USD pentru versiunea profesională a software-ului, deși nu există nicio funcție OCR, ci doar o opțiune de gestionare a documentelor scanate.

Permisiune

Pentru documentele stocate ca imagini, o rezoluție de 150 până la 200 dpi este de obicei suficientă, dar software-ul OCR funcționează mult mai bine dacă imaginile sunt stocate la o rezoluție mai mare de 300 dpi. Totul depinde de ceea ce ai nevoie. Dacă doriți doar să păstrați cel puțin lizibilitatea minimă a documentului scanat, puteți reduce cerințele de rezoluție. Dacă este important pentru tine calitate superioară, apoi creșteți-l corespunzător.

OCR pe web

Există mai multe servicii online care oferă serviciu de recunoaștere a documentelor scanate. Printre cele mai cunoscute sunt resursele gratuite OCR gratuit , NewOCRși OCR online. Sunt grozave pentru proiecte mici, adică lucrează doar cu documente mici. Mai întâi trebuie să scanați originalul în memoria computerului și apoi să încărcați o imagine a documentului pe un site web. Desigur, fiecare dintre resurse are propriile limitări atât în ​​ceea ce privește volumul, cât și conținutul documentului. Deci, aplicațiile web recunosc doar text, fără linii sau caractere suplimentare care sunt prezente pe pagină.

Serviciu OCR gratuit este gratuit, cu toate acestea, dimensiunea fișierului încărcat nu poate depăși 2 MB și nu conține mai mult de 5000 de pixeli, adică aproximativ 50 dpi pentru un document standard obișnuit. În plus, nu puteți procesa mai mult de 10 astfel de documente pe oră. Servicii de site NewOCRîl poți folosi și gratuit, dar interfața sa este extrem de primitivă, dar volumul documentelor procesate este de 2,5 ori mai mare - până la 5 MB. Și în sfârșit resursa OCR online necesită un cont gratuit, dar vă permite să încărcați până la 15 fișiere pe oră până la 4 MB la o rezoluție de aproximativ 200 dpi pe pagină. Dacă nu sunteți mulțumit de astfel de volume, atunci puteți cumpăra un acces plătit cu 3,95 USD (8 cenți pe pagină) și aveți posibilitatea de a procesa până la 50 de documente simultan sau puteți plăti 49,95 USD pentru procesarea a până la 5000 (1 cent). per pagină). Această aplicație web funcționează atât cu elemente text, cât și cu elemente grafice, dar, desigur, este departe de standardele Acrobat X sau FineReader 10.

Cărți electronice

Poate că, la fel ca mine, adori mirosul unei cărți adevărate, adori senzația hârtiei groase și aspectul unei grafice frumoase. Cu toate acestea, astăzi tot mai mulți oameni preferă să se ocupe de cărțile electronice, care sunt citite folosind așa-numitele cititoare speciale, tablete, smartphone-uri, playere și alte dispozitive portabile. O cantitate mare magazinele online oferă cantități pur și simplu gigantice de conținut. Dar ce se întâmplă dacă vrei să ai propria ta colecție de cărți electronice care nu sunt disponibile în format digital?

Pentru a converti cărțile „fizice” preferate în cărți electronice, trebuie mai întâi să le scanați și apoi să le convertiți în format text folosind un program OCR. Acest lucru este plictisitor chiar dacă utilizați un scaner FLATBED foarte rapid. Astfel de scanere seamănă cu „copiatoare”, având un capac de presiune, astfel încât să poată scana nu numai foi individuale, ci cărți întregi. Dacă sunteți gata să vă „devitați” cartea preferată, puteți utiliza scanerul SHEETFED, care funcționează ca un fax, adică cu pagini separate (cum ar fi ScanSnap S1500 de la Fujitsu și ScanJet Professional 3000 de la HP).

După ce vă convertiți documentele, manualele sau cărțile în formate PDF, Word sau fb2, puteți utiliza programe speciale pentru a organiza, edita sau citi documente electronice. De exemplu, Caliber sau Stanza. - organizator și editor gratuit pentru colecția ta de cărți electronice. Programul ajută la lucrul cu catalogul - organizați, clasificați, comentați, căutați, salvați cărți noi și vechi pe hard disk-ul computerului sau în memoria e-reader-ului.

Cu cât organizația este mai mare, compania în cauză, cu atât mai multe documente sunt stocate în arhiva acesteia, cu atât fluxul de lucru este mai complex, cu atât serviciile de digitizare a arhivelor arată mai atractive. Deci, ce este digitizarea arhivelor - acesta este procesul de scanare și catalogare a documentelor.

Dezavantaje atunci când lucrați cu arhive de hârtie

Deci, în arhive mari de căutat documentul solicitat de foarte multe ori trebuie să petreci mult timp și efort. În plus, documentele cele mai des folosite pot fi deteriorate sau „pierdute” în timp dacă sunt introduse din greșeală în arhivă. Adesea, în orice tip de afacere, există situații în care este necesară o eficiență ridicată în furnizarea de informații: uneori trebuie să pregătiți rapid documente pentru semnare, să faceți copii pe hârtie sau digitale, să le îmbinați frumos - atunci când lucrați cu arhivele de hârtie, eficiența se pierde. Aceasta nu este o listă completă a inconvenientelor cu care trebuie să vă confruntați atunci când lucrați cu arhivele de hârtie. Dar, în același timp, există o modalitate destul de simplă și elegantă de a rezolva problema - digitizarea documentelor.

Beneficiile digitizării arhivelor?

  • Este de remarcat reducerea încărcăturii pe arhivele de hârtie, precum și pe zona de fotocopiere. Deci, acum, dacă în același timp mai mulți angajați ai organizației au avut nevoie de un singur document, nu este absolut necesar să-l fotocopiați.
  • digitizarea documentelor poate reduce semnificativ costurile de întreținere arhiva de hârtie, precum și eliberarea spațiului folosit anterior pentru stocarea arhivelor pe hârtie.

Care este procesul de digitalizare a documentelor?

  • Specialiștii special pregătiți sortează documentele (pe teritoriul companiei dvs. sau le livrează pe teritoriul unei organizații angajate în digitizarea arhivelor), apoi, folosind scanere moderne, digitalizează fondul de arhivă în documente integrale sau individuale.
  • Codurile de bare și documentele tipărite sunt convertite automat în formă electronică de către sistemul optic de recunoaștere a caracterelor. În același timp, sunt salvate detaliile cheie ale documentelor: nume, dată, tip, contraparte și așa mai departe.
  • Pentru a evita eventualele distorsiuni la reintroducerea datelor de contact, telefoane pentru digitizarea informatiilor scrise de mana la digitizarea arhivelor se foloseste un sistem cu intrare dubla. Adică, digitizarea documentelor în viitor vă va oferi posibilitatea de a efectua o căutare operațională cu drepturi depline prin cuvinte cheie sau de a căuta anumite tipuri de documente/antreprenori.

Gestionarea fișierelor

Arhivele electronice vă permit să gestionați fișierele obținute în urma scanării. După digitizarea arhivelor, documentele pe hârtie sunt supuse sistematizării și descrierii. Sunt broșurate, se întocmește un catalog complet sistematizat de documente, ținând cont de nevoile și specificul companiei client. Acest lucru vă permite să economisiți timp și efort semnificativ atunci când lucrați cu arhive.

Lucrări privind digitizarea arhivelor

I.E. Hvorova

Procesul de digitizare a documentelor pentru a crea o arhivă electronică

Articolul este dedicat procesului de digitizare - cel mai convenabil mecanism pentru salvarea și utilizarea informațiilor în condiții moderne. Autorul are în vedere punctele principale ale procesului de digitalizare a materialelor de arhivă, inclusiv analiza modalități posibile conversia documentelor în formă electronică, categorii de documente pentru digitizare, formate pentru stocarea documentelor electronice și studiul standardelor moderne de digitalizare. Articolul analizează și el conditiile necesare pentru a crea o arhivă virtuală a unei persoane sau a unui eveniment istoric într-un context contemporan. Atentie speciala autorul acordă atenție particularităților organizării unei resurse electronice, explorează proiectele moderne existente pe această temă și analizează posibilele dificultăți pe care le poate întâmpina un cercetător la crearea unei arhive electronice.

Cuvinte cheie: digitizare, document de arhivă, fond electronic utilizare, arhivă virtuală.

realități viața modernă ne solicită din ce în ce mai mult să folosim în mod activ noile tehnologii informaționale. Era informațională introduce și propriile ajustări în lumea dialogului dintre sursele de arhivă și cercetător. Tehnologiile digitale moderne fac posibilă implementarea celor mai globale idei pentru crearea unui câmp de stocare alternativ - stocarea documentelor într-un plan virtual.

Digitalizarea documentelor de arhivă este de departe cel mai convenabil instrument pentru stocarea și utilizarea informațiilor. Permite o stocare mai sigură și mai economică, o recuperare și o utilizare ușoară.

© Khvorova I.E., 2017

informații, precum și pentru acces rapid la materialele de arhivă. Procesul de digitizare a documentelor se bazează pe ideea formării unui singur fond electronic de utilizare (denumit în continuare EFP). EFP este o colecție de copii electronice ale documentelor de arhivă care sunt înregistrate pe suporturi digitale și sunt destinate a fi utilizate în locul documentelor originale1. Un punct important în crearea EFP este necesitatea de a reglementa procesul de creare a acestuia.

Potrivit șefului adjunct al Agenției Federale de Arhivă O.V. Naumov, principalele obiective ale digitizării documentelor sunt extinderea și simplificarea accesului la documentele fondului de arhivă, asigurarea siguranței originalelor prin retragerea treptată a acestora din circulație, asigurarea accesului la fondul electronic, precum și accelerarea procesului de furnizare publică. servicii 2.

Luați în considerare punctele principale ale procesului de digitalizare. În primul rând, trebuie avut în vedere că fondul arhivistic Federația Rusă stochează o gamă largă de documente. Astfel, înainte de a începe să scanați documentele în sine, este indicat să le digitalizați aparat de referință științifică arhiva, creați inventare electronice pentru preluarea datelor. Digitalizarea inițială a inventarelor de arhivă permite utilizatorului să se familiarizeze cu lista documentelor stocate și să comande documente de interes prin internet fără a pleca de acasă. În același timp, este necesar să se țină cont și de faptul ediției științifice și tehnice a rubricilor de cazuri - numai dacă inventarul este îmbunătățit, este posibilă începerea digitizării fondului.

Categoriile de documente pentru digitizare includ nu numai documente pentru care există amenințarea de pierdere a informațiilor, ci și cele mai valoroase, unice materiale și documente solicitate. Criteriile pentru documente despre unicitatea și valoarea documentelor sunt oarecum neclare, iar cererea nu este o valoare constantă, prin urmare, atunci când alegeți materiale de digitizare, apare adesea întrebarea: ce documente trebuie digitizate în primul rând? Poate fi mai ușor să obțineți un eșantion mai eficient dacă procesul de selecție implică mai mult decât membri comisie de experti arhivă, dar și profesioniști implicați - istorici, politologi, sociologi, persoane publice etc. Procesul de creare a unui astfel de grup de lucru necesită o reglementare clară. De menționat că, în ciuda criteriilor de selecție formulate3, acestea nu sunt arhive obligatorii și regionale

dreptul de a alege acele documente care trebuie digitizate în primul rând.

Alegerea metodei de digitizare este importantă, deoarece suportul și formatul prezentării materialului poartă și informații utile pentru munca cercetătorului, de aceea este foarte important să le transmită în cea mai exactă formă comparabilă cu originalul.

În digitizarea directă a documentelor, este important să se respecte toate măsurile de securitate atunci când se lucrează cu originalul, o atenție deosebită trebuie acordată la scanarea cărților și a actelor antice (lumina, imprimanta, comportamentul specialistului în timpul digitizării trebuie să respecte standardele acceptate). În această etapă, capacitățile financiare ale proiectului de digitizare joacă un rol cheie - alegerea echipamentului pentru scanare determină gradul de siguranță al acestui proces pentru original. Alegerea unui dispozitiv hardware mai economic implică inevitabil riscul deteriorării ireparabile a documentelor și, de asemenea, reduce șansele de a crea o copie de înlocuire comparabilă, color4.

La digitizarea unui document, se fac cel puțin două copii ale originalului - o copie de lucru și o copie master. Ambele materiale trebuie să fie etichetate și înregistrate într-un registru special. Datorită acestui sistem de înregistrare, căutarea unui document scanat va fi mai rapidă și mai confortabilă pentru utilizator, iar acreditările vor facilita urmărirea documentului în general. Sistem informatic Arhiva.

Dintre formatele de stocare a imaginilor, formatele TIFF și JPEG sunt cele mai utilizate de arhiviști. Formatul TIFF își datorează popularitatea capacității de a păstra calitatea imaginii prin algoritmi de comprimare a datelor fără pierderi. Formatul JPEG are o capacitate ridicată de compresie, dar există o pierdere a calității imaginii. Este posibil ca modificările să nu fie vizibile cu ochiul liber, dar imaginea comprimată va avea contraste sau pixeli ascuțiți. Prin urmare, JPEG nu poate fi utilizat ca format intermediar în procesarea imaginilor. În JPEG este permisă salvarea numai a versiunii finale. În ceea ce privește celelalte tipuri de documente electronice și cele mai preferate formate pentru stocarea acestora, există documente text (ms-word, txt, pdf, html, xml, rtf), video (mov, avi, mpeg, mp4) și audio (wav). , aiff, mp3), desene (autocad), grafice și diagrame (tiff, pcx), baze de date sub formă de foi de calcul și baze de date relaționale (xls, xml, html, mdb). Pentru documentele fotografice, este acceptabil și formatul pdf. Matricea de date rezultată poate fi utilizată pentru transmisie prin canale digitale,

stocate pe medii optice digitale (CD-R, DVD-R cu scriere o dată, CD-RW, DVD-RW, discuri DVD-RAW), magnetice (hard disk-uri, dischete, benzi magnetice), unități flash etc. d.

Cerințele privind calitatea copiilor digitale rezultate nu sunt formulate clar. Nu există criterii de evaluare a calității copiilor electronice ale documentelor pe hârtie: parametrii imaginii, reproducerea tonului (contrast), luminozitatea, zgomotul, acuratețea culorilor, claritatea, rezoluția, distorsiunea geometrică etc. O serie de documente sunt deja utilizate în străinătate, ale căror experiența în evaluarea calității documentelor digitizate ar fi utilă pentru Rusia. Standardul național US ANSI/AIIM MS44 „Linii directoare pentru controlul calității scanerelor de imagine” stabilește și dezvăluie terminologia de bază, parametrii de bază și criteriile pentru evaluarea calității scanării, precum și abordări ale măsurării lor practice. Pe baza acestuia, ținând cont de cerințele moderne, în anul 2000 au fost elaborate standarde internaționale ISO pentru a evalua calitatea scanării documentelor alb-negru.

După digitizare, originalul este returnat înapoi în arhivă pentru stocare, iar copiile realizate completează fondul electronic al utilizatorului și devin disponibile cercetătorilor.

Căutarea unei soluții la problema stocării și utilizării operaționale a documentelor de arhivă a început la mijlocul anilor 1990, când Biblioteca Congresului SUA a început digitizarea totală a colecției existente de microfilme (ca colecție independentă și ca purtător principal de asigurări și fonduri ale utilizatorilor). În procesul de digitizare, specialiștii americani s-au confruntat cu nevoia de a dezvolta abordări unificate pentru implementarea proceselor de transfer de informații din mediul material în formă electronică, adică a existat necesitatea reglementării proceselor de digitizare.

După nivelul de reglementare al acestora, standardele moderne de digitalizare pot fi împărțite în 3 categorii de standarde: standard internațional, național și standard de organizare. Standardul internațional ISO5 este dezvoltat de un grup de oameni de știință, utilizarea lui oferă beneficii tehnologice, economice și sociale, dar nu este obligatorie pentru nicio țară care participă la organizația ISO. Standardul național este obligatoriu pentru utilizare de către autorități puterea statului diferite niveluri, este în curs de dezvoltare pentru a îmbunătăți procedura de digitizare, ținând cont de specificul legislației, standardelor documentelor

țiuni într-o anumită țară. Standardul organizației subliniază specificul unei anumite companii în procesul de conversie a unui document în formă electronică și stocarea și utilizarea ulterioară a acestuia. cel mai celebru standard national, care reglementează procesele de digitizare, este „Standardul de digitizare S6” (S6: Standardul de digitizare)6, pus în vigoare de Comitetul pentru standarde naționale din Australia și Noua Zeelandă în 2006. 7 Din păcate, în Rusia nu există un document similar care să reglementeze procesele de digitizare și creare a EFP .

În 2012, angajații Institutului de Cercetare de Documentare și Arhivare (VNIIDAD) și ai Agenției Federale de Arhivă (Rosarchiv) au dezvoltat „ Instrucțiuni privind copierea electronică a documentelor de arhivă și gestionarea matricei de informații primite. Modelul pentru aceste recomandări este Standardul de digitizare S6 și Ghidurile tehnice FADGI. Pentru continuarea lucrărilor în această direcție, se pare oportună elaborarea unei Strategii de elaborare și actualizare a actelor de reglementare și metodologice sectoriale care reglementează diverse domenii de activitate în domeniul informatizării arhivelor, precum și elaborarea unui regulament și plan de perspectivă pentru implementarea acestuia. Dezvoltatorii au oferit puncte cheie care trebuie luate în considerare la întocmirea unui document de reglementare.

1. Structura și conținutul documentelor elaborate și puse în aplicare ale sistemelor internaționale și naționale de standardizare sunt determinate de specificul Cadrul legalțara de unde au provenit. Prin urmare, traducerea și utilizarea lor directă în Federația Rusă necesită o abordare echilibrată.

2. Este necesar să creați mai mult de unul document normativ, reglementând problemele digitizării, ci un set de acte juridice care descriu cerințele pentru toate etapele și aspectele acestui proces.

3. Structura și conținutul general al acestei documentații normative și metodologice pot fi construite pe analogi străini aleși de experții din industrie ca exemple care sunt cele mai apropiate și adecvate condițiilor rusești. În același timp, evoluțiile interne ar trebui să reflecte pe deplin specificul tuturor proceselor și aspectelor digitizării (inclusiv cerințele pentru echipamente, personal, proceduri și managementul calității) inerente Rusiei8.

Digitalizarea documentelor este o măsură necesară pentru organizarea accesului rapid la documentele de arhivă. Prezența este cu siguranță

Gama de documente vă permite să creați o nouă resursă de informații, ușor de utilizat și utilă din punct de vedere științific - o arhivă virtuală. Exemple de astfel de depozite virtuale pot fi văzute pe site-ul Arhivei de Stat de Literatură și Artă din Rusia.

Arhiva virtuală a I.A. Bunin este o resursă cu o clasificare convenabilă a documentelor trimise și o interfață ușor de utilizat. Documentele sunt împărțite în trei grupe: „Manuscrise”, „Decupări din ziare și reviste”, „Materiale vizuale” și sunt copii scanate ale originalelor fondurilor Arhivei de Stat de Literatură și Artă Rusă și Arhivei Diasporei Ruse. în Leeds9. Elaboratorii proiectului conturează punctele cheie pentru implementarea unor astfel de proiecte: problemele financiare, problema dezunității documentelor de arhivă și necesitatea de a negocia cu depozitele diferitelor instituții și chiar țări pentru a colecta materialul necesar și, în final, soluționarea aspecte juridice – deoarece se aplică și publicarea electronică a materialelor Drepturi de autor. Resursa este un exemplu pozitiv de implementare a unui proiect de creare a unei arhive virtuale. Site-ul web al Arhivei de Stat de Literatură și Artă din Rusia oferă, de asemenea, exemple excelente de depozite electronice ca resursă dedicată documentelor Războiul Patriotic 1812 și primul război mondial.

Creatorii depozitului electronic numit „Arhiva virtuală reunită a lui Osip Mandelstam” au fost Universitatea Oxford și Societatea Mandelstam. Dezvoltatorii proiectului și-au propus să identifice, să descrie și să plaseze pe Internet toate sau cel mai mare număr posibil de materiale creative și biografice supraviețuitoare ale lui Osip Mandelstam, indiferent de locația lor fizică10. În același timp, proiectul combină manuscrise, stenograme de texte, precum și comentarii la acestea.

Căutarea documentelor este cea mai importantă etapă în realizarea unor astfel de proiecte. Acest proces este complicat de faptul că unele dintre colecțiile cunoscute și introduse anterior pot să nu mai existe. Odată scoși la vânzare în anii 1990, și-au schimbat proprietarii, chiar și ale căror nume nu sunt întotdeauna posibil de stabilit. În alte cazuri, proprietarii nu reușesc să găsească anumite autografe sau documente. Acest lucru se explică pe deplin prin faptul că achiziția de fonduri arhiv-manuscrise cu documente

figurile diasporei ruse a fost realizată în principal prin donație și nu a fost sistematică11. Dezvoltatorii notează că același lucru se întâmplă și cu arhivele de stat. Așadar, în Arhivele Naționale ale Franței, de câțiva ani, nu au putut găsi actele de înmatriculare ale O.E. Mandelstam (au fost redescoperite în aprilie 2008)12.

Este important de menționat că arhiva virtuală a O.E. Mandelstam nu este doar un bun exemplu de implementare a unui astfel de proiect, ci și, datorită unei descrieri detaliate a procesului de creare a unei astfel de arhive pe site, este un fel de tutorial pentru adepţii şi cercetătorii procesului de digitalizare.

O analiză a proiectelor rusești implementate pentru a crea depozite virtuale de materiale istorice evidențiază problema dezunității documentelor și dificultatea de a le găsi. Astfel, atunci când pregătim un proiect, este important să ne concentrăm pe o posibilă cooperare cu arhivele străine.

Astfel, rolul muncii în comun, proiectelor comune de creare a unui singur câmp virtual pentru stocarea materialelor pe același subiect este în creștere.

La digitizare, trebuie să se acorde atenție procesului de selectare a documentelor pentru digitizarea acestora, precum și selecției echipamentelor de scanare de înaltă calitate, pentru a se asigura că procesul de digitizare este sigur pentru originale. Cu toate acestea, în acest moment, una dintre cele mai grave probleme în această temă rămâne necesitatea de a reglementa procesul de digitalizare (inclusiv descriere detaliata procesul de selectare a materialelor și de fixare a terminologiei). Fără un standard adecvat, aprobat legal, procesul de creare a unei arhive virtuale rămâne laborios și de neatins pentru majoritatea cercetătorilor.

Note

Orientări pentru copierea electronică a documentelor de arhivă și gestionarea matricei de informații primite. [Resursa electronica] URL: http://archives.ru/documents/rekomend_el-copy-archival-documents/section-2.shtml (data accesului: 13/05/2016). Caracteristici de digitizare a documentelor în arhivele contemporane. [Resursa electronica] URL: https://www.pcweek.ru/ecm/article/detail.php7ID-154329 (accesat 13/05/2016).

Yumasheva Yu.Yu. Arhivele și „cursa înarmărilor digitale” // Informatică istorică. 2013. Nr 3. P. 93.

ISO - Organizația Internațională de Standardizare. Dezvoltator și editor standarde internaționale. [Resursă electronică] URL: http://www.iso. org/iso/ru/ (data accesului: 13.05.2016).

Raport privind activitatea de cercetare pe tema 2.2.4 „Elaborarea unui proiect de standard industrial pentru crearea de copii electronice ale documentelor de arhivă”, Plan de cercetare și dezvoltare efectuată pe baza sarcinii de stat a Agenției Federale de Arhivă pentru 2014 Nr. 89 din 26.12.2013 (prima etapă) „Cercetarea și analiza documentației străine de reglementare și metodologie care reglementează problemele digitizării documentelor de arhivă” / Yu.Yu. Yumashev. M.: VNIIDAD, 2012. S. 84-163. Acolo. S. 20.

Arhiva electronică unită a lui Ivan Bunin. [Resursa electronica] URL: http://www.bunin-rgali.ru/ (data accesarii: 13/05/2016). Arhiva virtuală reunită a lui Osip Mandelstam. [Resursa electronica] URL: http://mandelstam-world.info/intro.php (data accesarii: 13/05/2016).

Popov A.V. Diaspora și arhivele rusești: Documente ale emigrației ruse în arhivele Moscovei: probleme de identificare, achiziție, descriere și utilizare (Materiale privind istoria emigrației politice rusești. Numărul 4). M.: RGGU, 1998. S. 150-151.

Arhiva virtuală reunită a lui Osip Mandelstam.