Transfer în format digital al documentelor de arhivă. Scanarea arhivei: cum sunt digitizate documentele de arhivă

Digitalizare arhive de hârtie include scanarea și catalogarea documentelor. Cu cât este mai mare organizația, compania, cu atât fluxul documentar este mai complex, cu atât mai multe documente sunt stocate în arhivele sale și, în consecință, serviciile de digitizare a arhivelor arată mai atractive.

Economii la căutare

  1. Adesea pentru arhivare documentul solicitat este nevoie de mult timp și efort. Sau poate apărea o situație când același document este cerut de mai mulți angajați deodată - în acest caz, trebuie să faceți o copie a acestuia.
  2. În plus, este de remarcat faptul că accesul frecvent la documentele pe hârtie duce, mai devreme sau mai târziu, la deteriorarea acestora și, uneori, la „pierdere”, dacă cazurile sunt plasate greșit în arhivă.
  3. Dar pentru a rezolva toate aceste probleme este destul de simplu - trebuie doar să asigurați digitizarea arhivelor pe hârtie, să utilizați sisteme informatice automatizate în munca dvs. care vă vor oferi căutare promptă, precum și acces la copiile electronice ale documentelor.
  4. Digitalizarea arhivelor de hârtie are multe avantaje. Și vorbim nu numai despre noi oportunități calitativ pentru furnizarea și utilizarea documentației companiei, ci și despre asigurarea siguranței acestor informații.

Avantajele documentelor digitizate:

  • reducerea încărcăturii pe arhiva hârtiei și zona de fotocopiere;
  • posibilitatea eliberării spațiului arhivistic;
  • reducerea costurilor de întreținere a arhivelor pe hârtie.

Digitalizarea arhivelor de hârtie: etape

Primul pas. Toate lucrările de digitizare a arhivelor începe cu examinarea documentelor. În urma analizei documentelor, se determină structura matricei de hârtie, precum și cantitativă și caracteristici de calitate documente. Pe baza rezultatelor examinării, alegerea tehnologiei și digitizarea documentelor, criteriile de evaluare a calității, alegerea compoziției echipamentelor se realizează, se convine termenele de execuție și bugetul.

Faza a doua este o scanare directă. Digitalizarea arhivelor este procesul de creare a imaginilor grafice ale unui document folosind scanere. Înainte de a converti documentul în formă electronică, operatorul va selecta modul optim de scanare, va efectua, de fapt, scanarea, controlând în același timp calitatea imaginilor rezultate pe monitor.

Efectul introducerii arhivei electronice

Rezultatul digitizării arhivelor pe hârtie sunt copiile electronice ale documentelor. Echipamentul profesional pe care îl folosește compania noastră vă permite să scanați diverse documente la viteze de până la câteva mii de pagini pe zi - în modul lot. Fișierele rezultate sunt scrise pe unități flash, CD-uri, DVD-uri și alte medii.

Rezultatele digitizării arhivării

Imediat după finalizarea digitizării arhivelor, imaginile grafice sunt supuse procesării automate - împărțirea în pagini de extensii, tăierea de-a lungul marginilor, alinierea prin linii, eliminarea zgomotului, îmbunătățirea calității imaginii și așa mai departe. Puteți seta parametrii pentru catalogarea documentelor scanate la discreția dvs., asigurând astfel optimizarea proceselor de afaceri din partea managementului documentelor.

În prezent, se acordă din ce în ce mai multă atenție problemelor de proprietate culturală. În acest sens, se aprobă programe guvernamentale, în cadrul căruia, conform intenției creatorilor lor, utilizarea noilor tehnologii, abordări inovatoare, precum și experiența mondială vor asigura siguranța mostenire culturala, documente semnificative din punct de vedere istoric. Prin urmare, astăzi arhivele Rusiei convertesc documentele de hârtie în formă electronică. Despre care a fost începutul acestei lucrări de amploare, cu ce dificultăți se confruntă arhiviștii și cum rezolvă problemele de conservare a documentelor digitalizate, șef adjunct al Agenției Federale de Arhivă (Rosarchive) Oleg Naumov a spus unui corespondent PC Week/RE Olga Zvonareva.

PC Week: Vă rugăm să ne spuneți cum a început procesul de digitizare a documentelor de arhivă, care sunt caracteristicile acestei lucrări?

Oleg Naumov: Sarcina conversiei în masă a documentelor de arhivă în formă electronică a fost stabilită în programul Societatea Informațională (2011-2020). Aceasta nu este deloc o sarcină ușoară. În plus, una este să digitizezi documentele, iar alta este să digitizezi aparat de referință științifică(NSA), fără de care nu se poate găsi documentul solicitat. Prin urmare, atunci când acum doi ani, posibilitatea de finanțare normală a muncii în cadrul federal programul țintă„Cultura Rusiei 2012-2018”, în primul rând, au început să creeze în în format electronic NSA, permițându-vă să căutați în mod eficient documente.

Săptămâna PC: Ce software folosit pentru asta?

ESTE EL.: Cu mult înainte de adoptarea programului „Societatea informațională”, Arhivele Federale au început să dezvolte software-ul standardizat integral rusesc pentru organizarea contabilității documentelor - pachetul software „Fondul de arhivă”. sistem proprietar Federația Rusă, introdus la nivelul arhivelor federale, regionale și municipale. Odată cu utilizarea sa, a fost creat un catalog central de stocuri, găzduit pe portalul Arhivele Rusiei. Inițial, Fondul de Arhivă a fost creat ca aparat contabil, dar apoi a început să fie folosit ca aparat de căutare. Acum, o serie de arhive folosesc motoare de căutare specializate.

PC Week: Ce experiență de arhivă a fost fundamentală în digitizarea inventarelor?

ESTE EL.: Arhiva istorică de stat rusă din Sankt Petersburg a fost prima care a digitizat toate inventarele, doar datorită circumstanțelor. Când a apărut întrebarea despre mutarea lui, inventarele au fost scanate, iar imaginile lor electronice au fost folosite în toate etapele mutării, adică fiecare cutie, fiecare caz a fost urmărit.

A fost o experiență bună, dar din punctul de vedere al dezvoltării tehnologiei informației nu a avut prea mult succes. Deși a devenit posibilă cunoașterea lor în sala de lectură și online, colecția de imagini grafice nu permite căutarea automată. Acolo unde o mai mare comoditate este asigurata utilizatorilor de inventarele traduse intr-un format de baza de date, cu posibilitatea unei cautari simple si avansate. Rosachiv a început să finanțeze activ aceste lucrări. Până în prezent, au fost realizate circa 20-30% din inventarele arhivelor federale.

Săptămâna PC: cu ce provocări se confruntă arhivele atunci când digitizează documente?

ESTE EL. Prima problemă este volumul total. Volumul total Fond de arhivă Federația Rusă deține 494 de milioane de dosare, dintre care 9% se află în arhivele federale.

Dar cel mai dificil lucru este să determinați ce documente ar trebui digitizate. Cel mai simplu răspuns este cel mai căutat. Și cum să determinăm această cerere? Astăzi avem nevoie de un lucru, mâine de altul. Si in ora sovietică a fost introdus conceptul de fonduri şi documente de arhivă deosebit de valoroase. Au creat un fond de asigurare pe microfilm, precum și un fond de utilizare. Cu toate acestea, astăzi aceste documente practic nu sunt solicitate. Adică, criteriile pentru valoarea și cererea de documente din epoca sovietică nu funcționează deloc acum. Cererea este în continuă schimbare. Este aproape imposibil de stabilit cu siguranță care documente vor fi cele mai solicitate.

Latura tehnică a problemei este, de asemenea, importantă. De exemplu, a existat o cerere uriașă pentru compilarea propriilor pedigree. Este bun si necesar. Au început să ordoneze activ aceste cazuri: registre parohiale, povești de revizuire. Dar ele nu sunt absolut adaptate pentru o astfel de utilizare în masă. Scanarea lor ca fiind cele mai populare este o prostie. Dintr-o carte de 80 cm grosime, o persoană are nevoie de o singură pagină. Și pentru a satisface această cerere, trebuie să scanați întreaga mie de pagini. Da, chiar și cu cifra de afaceri. Dar, pe de altă parte, dacă aceste documente sunt scanate, atunci originalele sunt scoase din circulație și siguranța lor fizică este garantată. Toate sunt unice. Și cel mai important, nefericiții custodi (inclusiv multe femei) nu vor purta toate aceste tone de hârtii în brațe.

Totuși, aici întâlnim forma furnizării de informații. La urma urmei, a fost mult mai interesant pentru utilizator să obțină nu o imagine, ci o decriptare și o bază de date. Și paleta acestor documente este uriașă. Doar în RGADA în fondul 350 "Landratsky cărți și cărți de revizuire" - mai mult de cinci mii de cazuri, aproximativ 3 milioane de pagini. Câți oameni trebuie să fie implicați? În Perm, au găsit o ieșire bună: au atras finanțe care au fost alocate pentru a oferi locuri de muncă. Lucrarea a fost făcută de oameni acasă. A rezolvat cu succes problema șomajului. Și până la urmă au reușit să facă ceea ce nimeni altcineva din Rusia, în amintirea mea, nu putea face.

Experiența scanării în arhivele federale ne permite să tragem două concluzii. În primul rând, crearea unui fond electronic de utilizare fără a crea o NSA este o ocupație neproductivă. Se dovedește o grămadă uriașă de scanări, unde este imposibil să găsești cea potrivită. În al doilea rând, scanarea, în special scanarea în masă, este oportună pentru a expune complexele finalizate - fonduri sau inventare. În același timp, cazurile ar trebui scanate în întregime pentru a evita conflictele în cazul erorilor de numerotare. ÎN cazuri individuale, datorită unicității și semnificației documentelor, indiferent dacă există sau nu vreun text pe versoul foii, este necesară digitizarea foii, inclusiv a versoului. Apoi, întrebarea că este posibil să fi ascuns ceva dispare.

Există o problemă cu alegerea echipamentului. Undeva ai nevoie de un scaner simplu, undeva ar trebui să fie mai complicat. De exemplu, pentru digitizarea cărților Landrat, a fost comandat special un „leagăn adânc”. În caz contrar, nu copiați, deoarece grosimea cotorului unor cărți ajunge la 80 cm.

PC Week: Care este obiectivul principal al digitalizării în prezent?

ESTE EL. Sunt trei. Prima este extinderea și simplificarea accesului la documentele Fondului Arhivistic. Al doilea este asigurarea siguranței originalelor prin retragerea acestora din circulație și asigurarea accesului la fondul electronic de utilizare. A treia este simplificarea furnizării serviciilor publice. Acum există multe solicitări individuale ale cetățenilor pentru documente privind personalul. De asemenea, arhivele încep să le digitizeze și să folosească copii electronice pentru a pregăti răspunsurile, ceea ce grăbește foarte mult munca.

PC Week: Cum digitizează arhivele documentele?

ESTE EL. Procesul merge diferit: undeva o fac singuri, folosind mijloace improvizate sau achiziționând o varietate de echipamente. A doua modalitate este implicarea organizațiilor externe. Dar totuși, nu există încă un răspuns fără echivoc la cea mai importantă întrebare: la ce ne străduim prin digitizarea documentelor?

PC Week: Și nimeni nu-i întreabă?

ESTE EL. De ce, întreabă toată lumea. Dar cum să găsești singurul răspuns corect? Desigur, avantajul utilizării documentelor digitizate este evident. Aceasta și securitatea și accesul de la distanță și ușurința de a furniza informații și ușurința de a face copii - o gamă completă de plusuri. Un alt lucru este cum se poate realiza acest lucru? Aici sunteți utilizator, ați intrat pe site și ați stabilit că documentele de care aveți nevoie sunt în depozit. Să spunem în Perm. Am mers pe site prin link, am găsit descrieri de cazuri. Există o chestiune interesantă. Și cum să-l obții? Ei bine, dacă este deja digitizat. Și dacă nu? Mergeți singur la arhivă și comandați originalele? Sau arhiva ar trebui să digitalizeze toate cazurile? Dar acest lucru este imposibil. Deci, de fapt, mai rămâne o singură opțiune. Crearea în fiecare arhivă a posibilității de producere promptă a copiilor electronice la cererea utilizatorului. Și nu trebuie să fie propria ta unitate. Ar putea fi și externalizare. Dar un astfel de serviciu trebuie furnizat prompt. Dar să faci aceste copii, după cum arată experiența, are sens doar atunci când există deja sistem electronic, care va permite plasarea de înaltă calitate și structurată a acestor materiale. Atunci va funcționa. Când o vom face și dacă vom putea să o facem, sincer să fiu, nu știu.

Săptămâna PC: Probabil, chiar înainte de aprobarea programului Societatea Informațională în 2010, se derulase deja lucrări de digitalizare?

ESTE EL. Da. Au fost proiecte separate. De exemplu, Arhiva Electronică a Comintern sau o colecție de documente de la SVAG. De regulă, acestea au fost implementate în comun cu parteneri străini. Fondurile proprii pentru implementarea lor nu au fost suficiente. Treaba nu a fost ușoară. Au fost dificultăți tehnice, metodologice, organizatorice și tehnologice. Dar experiența s-a acumulat. Și acum este foarte util.

PC Week: Adică după aprobarea programului au început să stabilească care ar trebui să fie principalele criterii de digitizare a documentelor?

ESTE EL. Acest program, să zicem, le-a permis arhiviștilor să atragă atenția autorităților asupra faptului că există o problemă și trebuie rezolvată. Pregătește și aprobă programe de digitalizare. Și atrageți finanțare pentru asta. Dar astăzi nu există un criteriu universal. Este dificil să definești o singură abordare pentru toată lumea, deoarece arhivele stochează documentație complet diferită.

PC Week: Deci, fiecare arhivă a definit de fapt criteriile în sine?

ESTE EL. Defapt da. În principiu, acestea sunt patru criterii, sunt general acceptate, dar nu voi spune că sunt cele mai corecte. Aceasta este cererea de documente, asigurarea siguranței, facilitarea muncii angajaților arhivei, îmbunătățirea condițiilor de deservire a utilizatorilor. În plus, accelerează munca. Dacă am un NSA electronic pe site-ul meu, atunci utilizatorul vine la arhiva pregătită uitându-se la inventarul de pe Internet. În cazul în care documentele solicitate au fost deja digitizate, acesta are posibilitatea de a le vizualiza pe computerul său fără a merge la arhivă, sau de a le primi în sala de lectură fără întârziere.

PC Week: Se pare că fiecare arhivă trebuie să decidă singură ce să digitalizeze în primul rând?

ESTE EL. Destul de bine. Acesta ar trebui să fie un program exclusiv individual pentru fiecare arhivă. Nu poți să faci unul. Depinde de mulți factori: de oportunitățile financiare, de gradul de dezvoltare și implementare a tehnologiilor IT, de cererea specifică. Deci, cineva este la mare căutare pentru documente privind personalul și este necesar să satisfacă nevoile cetățenilor. Deși din punct de vedere arhivistic, aceste documente nu sunt permanente, ci au o perioadă de păstrare temporară de 75 de ani. Dar acest lucru ușurează munca și ajută oamenii, deoarece o persoană nu așteaptă un răspuns la o cerere timp de o lună, ci primește informațiile necesare în două zile. Deci, este necesar să se investească în acest efort și resurse.

Săptămâna PC: Atunci când se stabilesc prioritățile documentelor de digitizat, arhivele le coordonează cu Arhivele Ruse?

ESTE EL. Dacă vorbim de arhive regionale, atunci nu. Aceasta este afacerea fiecărei arhive. Ne trimit programele lor de informatizare si digitizare. Îi cunoaștem și ne dăm sfaturile. Îi ajutăm cât putem, alocam fonduri din FTP. Un alt lucru sunt arhivele federale. Aici poziția Arhivei Ruse este de o importanță decisivă. Dar nici aici nu există un criteriu universal. Pentru a satisface cererea din ce în ce mai mare de informații genealogice, Arhiva Rusă a alocat peste 40 de milioane de ruble. pentru transferul cărților landrat stocate în RGADA în formă electronică. Răspunzând interesului constant al societății pentru istoria patriei noastre în trecutul recent, în iunie a acestui an a fost lansat site-ul „Documente ale erei sovietice”, unde imagini cu documente din fondul personal al lui IV Stalin și Biroul Politic al Comitetul Central sunt postate. Au fost pregătite proiecte pe internet dedicate aniversării a 1150 de ani Statalitatea rusă, 400 de ani de la sfârșitul Necazurilor, 200 de ani Războiul Patriotic 1812. Desigur, acolo au fost postate imagini cu cele mai importante și populare documente.

PC Week: Deci acum vor fi emise doar copii electronice în sala de lectură a arhivei, și nu documente originale?

ESTE EL.În mod ideal, aveți nevoie de o persoană care să găsească documentul pe care îl caută pe site, să comande o cutie și să i se ofere documente scanate. Iar originalul rămâne intact. Cu toate acestea, există cazuri când trebuie să vedeți originalul. De exemplu, oricât de bună este tehnica, aceasta nu va transmite filigrane. Și pe ele puteți seta data documentului. Dar astfel de cazuri sunt unul la o mie.

PC Week: Se pare că arhiva a fost furnizată utilizatorului serviciu public, dar după ce trebuie salvată copia digitizată a documentului?

ESTE EL. Desigur, acesta este avantajul scanării. Anterior, existau microfilme, xerox, dactilografiat. Și arhivirul, după ce a făcut copii, le-a dat utilizatorului. Adică nu avea o copie a documentului. În cazul digitizării, rămâne o copie. Dar pentru aceasta locul de depozitare ar trebui să fie clar definit. Și dacă mai târziu există o a doua cerere, nu va fi nevoie să ridicați cazul. Trebuie să câștigi experiență în acest tip de muncă.

PC Week: Cum sunt determinate termenele limită pentru digitizarea matricelor de documente?

ESTE EL. Termenele depind de trei motive: de posibilitățile tehnice și financiare și de starea documentelor. Există documente care sunt legate în așa fel încât nici cea mai modernă tehnologie nu poate obține pe deplin textul. Adică vor trebui să fie brodate, ceea ce nici documentelor, nici arhiviștilor nu prea le plac. Scanează. Apoi coaseți înapoi. Dureaza. De asemenea, termenii depind de volumul de cutii, de numărul de foi din ele. Nu este atât de dificil să scanezi un teanc de hârtie într-un format standard, dar un card de 3x8 m este deja mai dificil. Conform documentelor contabile, aceasta este o singură foaie. Dar este scanat doar pe părți. Și apoi, în software, trebuie să „coaseți” totul, să îl ajustați și să vedeți cum va arăta acest document.

Săptămâna PC: Cum se lucrează la implementarea punctului 89 al programului țintă federal „Cultura Rusiei (2012-2018): formarea resurselor electronice de arhivă și furnizarea lor pe internet”?

ESTE EL. Ca parte a implementării acestui articol, inventarul este în curs de digitalizare. Se digitizează și documente, inclusiv cărți landrat. Mai mult, încercăm să ajutăm și regiunile: includem aproximativ cinci sau șase regiuni pe an în acest program și alocam de la 10 la 15 milioane de ruble. Creăm expoziții online etc. În total, 67 de milioane de ruble sunt alocate pe an pentru implementarea lucrărilor în cadrul acestui program.

PC Week: Distribuția fondurilor depinde de gradul de importanță și semnificație a documentelor?

ESTE EL. Da. Arhivele depun cereri într-o anumită formă de participare, luăm în considerare aceste cereri. De asemenea, se aplică firmele care cred că oferă lucruri interesante. Le luăm în considerare, alegem soluții interesante promițătoare, întocmim un plan general și efectuăm achiziții la baza competitiva. Anul trecut, au fost 52 de contracte de stat pentru acest eveniment. Adică în fiecare săptămână semnam un contract.

PC Week: Ați atins subiectul documentelor deja stocate în arhive, începând cu secolul al XI-lea, dar și noi documente pe hârtie vin în arhive și aceasta este o gamă uriașă. Cum se lucrează cu ei? Cum se rezolvă problema digitizării lor?

ESTE EL. Pentru noi, un singur lucru contează: dacă aceste documente aparțin sau nu din componența fondului arhivistic. Adică sunt supuse unui termen de valabilitate permanent sau nu. Și apoi, din punct de vedere al utilizării, nu contează deloc dacă acestea sunt documente din secolele XI sau XXI. În acest sens, ei sunt egali. Un alt lucru este că avem în mod firesc un fond de asigurări și un fond de utilizare pentru documente din secolul al XI-lea. Și aceste documente unice sunt extrem de rar înmânate. Există un registru de stat special al documentelor unice ale Federației Ruse, care este postat pe site-ul Arhivei Federale și conține descrierile și imaginile electronice ale acestora.

PC Week: În acest sens, este mai ușor de acceptat pentru stocare documente traduse în format electronic? De exemplu, au intrat în vigoare modificări ale legislației privind documentația de personal, iar arhivele, probabil, o pot accepta în format electronic?

ESTE EL. Cred ca da. Dar nu are sens ca arhiva statului să ia documente contemporane momentan fara personal. Pentru ce? Calculeaza-ti pensia? Există Fond de pensie, care a înființat înregistrarea de specialitate a cetățenilor, din anul 2000.

PC Week: Deci arhivele nu acceptă înregistrări vechi de 75 de ani?

ESTE EL. Nu, l-am păstrat mult timp. Și acum negociem activ cu același Fond de pensii, ca să putem reduce această perioadă pentru documentele pe hârtie de la 75 la 15 ani. Dar Fondul de Pensii se teme că sistemul lor electronic s-ar putea prăbuși.

Și acele documente care în cele din urmă ne vor ajunge în formă electronică sunt o problemă foarte mare și complet separată. Acestea sunt întrebări despre managementul documentelor electronice, documente electronice. Cum să le luați, cum să le păstrați, este o problemă separată.

PC Week: Nu ați primit încă astfel de documente?

ESTE EL. Nu, au. Materialele recensământului populației și ale recensământului agricol au fost acceptate de GARF în formă electronică. Un alt lucru este că aceste recensăminte există doar în formă electronică. Dar nu există încă o acceptare în masă a documentației de afaceri. Există destul de multe probleme nerezolvate aici.

PC Week: Și cum rămâne cu actele organizațiilor lichidate? Sunt acceptate pentru depozitare?

ESTE EL. Noi acceptam. Adevărat, în cazul falimentului și lichidării unei companii, administratorii de faliment sunt obligați să găsească bani pentru a descrie documentele organizațiilor lichidate, dar nu întotdeauna îi găsesc.

PC Week: Arhivele Federale gestionează 15 arhive federale. Arhivele regionale în în prezent eliminat de sub controlul departamentului dvs.?

ESTE EL. Da, nu există control direct asupra lor. Ei se supun organele executive subiectii federatiei. Undeva acestea sunt servicii de arhivă independente. Undeva, ei, ca și noi, sunt incluși în ministerele culturii. Undeva - la Ministerul Justiției sau direct la biroul guvernatorului. Dar verticala puterii care a existat în Uniunea Sovietică și a durat până în 2004, din păcate, nu mai există. Atâta timp cât menținem unitatea metodologică. Cum putem ajuta arhivele regionale. Reprezentanții Arhivelor Federale participă la evenimentele anuale organizate în fiecare District federal consilii științifice și metodologice. O dată pe an se ține Consiliul Arhivistic, unde se adună arhiviști din toată țara. Adică conexiunile rămân. Glumim că un arhivar este o meserie în care în orice oraș te poți găsi fără bani și lucruri, să vii la colegii arhivisti, iar ei te vor primi, te vor hrăni și te vor trimite acasă. Există o frăție care, de fapt, nu este caracteristică nici unei alte profesii.

Săptămâna PC: Mulțumesc pentru chat.

La birou, este adesea necesar să trimiteți copii prin e-mail - versiuni electronice ale documentelor tipărite. Acestea pot fi diverse acte, facturi, scrisori, contracte, charte, note de birouși orice alte documente posibile.

Acasă avem fotografii vechi care au devenit decrepite de-a lungul anilor și am dori să le păstrăm.

Ni s-a oferit o carte interesantă pentru o vreme, dar vrem să o avem cu noi. Cum să faci totul? Documentele noastre pe hârtie de scurtă durată trebuie convertite în formă electronică, adică digitalizate și stocate.

Digitalizarea este conversia unei imagini sau a unui semnal audio/video analogic într-un format digital adecvat pentru înregistrarea pe suport electronic.

Pentru a digitiza imaginile unui obiect, există dispozitive speciale - scanere. Există scanere de coduri de bare, scanere de film. Scanerele biometrice citesc modelul retinei ochiului sau modelul papilar al pielii degetelor. Forma unui obiect tridimensional este citită de un scaner 3D tridimensional.

În scanere pentru prelucrarea suporturilor de hârtie - desene, fotografii, documente text, imaginea este iluminată linie cu linie cu o lampă specială, iar fluxul de lumină reflectat este focalizat pe o matrice fotosensibilă. Convertorul analog-digital convertește semnalele electrice primite într-un sistem de date binar, care formează o copie digitală a imaginii.

Alegerea unui scaner depinde de sarcinile și specificul aplicării acestuia. Un scanner dintr-un birou este aproape întotdeauna folosit pentru a digitiza documente. Chiar dacă fotografiile sunt scanate, acestea nu sunt supuse unor cerințe de înaltă calitate în birou. O rezoluție de 300 dpi este suficientă pentru a asigura funcționarea corectă a programelor de recunoaștere și pentru a obține text lizibil. Orice scaner produs astăzi oferă o rezoluție acceptabilă pentru munca de birou.

Acest lucru este valabil și pentru profunzimea culorii. Aproape fiecare scaner modern reproduce nivelul de culoare gri necesar documentelor tipărite.

Este important la birou, unde sarcina principală este digitizarea rapidă pagină cu pagină a documentelor text, aceasta este automatizarea procesului de scanare. Pot fi utilizate scanere cu alimentare cu coli. Aici, o coală de document este introdusă în fanta aparatului și trasă, ca într-un aparat de fax, de-a lungul rolelor de ghidare. Un astfel de scaner este convenabil cu un alimentator automat de coli încorporat. Încărcăm mai multe coli dintr-un document cu mai multe pagini în tavă și, în timp ce scanerul se digitalizează, facem simultan și altceva. Totul este simplu aici. Dacă este instalat software-ul OCR corespunzător, o singură apăsare de buton este suficientă pentru a digitiza și salva un document în formatul dorit pe un astfel de scaner.

O soluție modernă de birou pentru un departament al unei companii de inginerie, de exemplu, ar putea fi un scanner A3 inclus într-un dispozitiv multifuncțional împreună cu o imprimantă A3/A4. Pe un astfel de MFP este convenabil să digitalizați și să faceți copii ale desenelor.

Este clar că nu va funcționa să scanezi o revistă legată sau o întindere a unei cărți pe un scaner cu alimentare cu coli.

Pentru a scana documente față-verso, există scanere duplex, în care două elemente de scanare procesează ambele părți ale foii într-o singură trecere.

O soluție bună pentru casă este un MFP cu jet de cerneală color. MFP este un dispozitiv multifuncțional care include un scanner și o imprimantă. Un astfel de dispozitiv este și un copiator. Adică, MFP poate scana automat un document și poate imprima o copie a acestuia - creați o fotocopie a documentului.

Dispozitivul compact cu funcții combinate ocupă mai puțin spațiu pe masă. Costul acestuia va fi semnificativ mai mic decât costul total al dispozitivelor incluse în el, dacă le cumpărați separat. Pe o imprimantă color cu jet de cerneală realizăm fotografii color și cărți de vizită de înaltă calitate, iar cu un scaner plat digitalizăm documente, albume foto sau cărți necesare.

În următoarele lecții, vom învăța cum să digitalizăm, convertim și salvam manual documente text pe un scaner plat, pagină cu pagină.

În aceste exemple, am folosit un MFP pentru desktop A4 popular pentru scanare. Un astfel de dispozitiv ieftin este cea mai bună soluție pentru casă și poate fi un al doilea MFP suplimentar la birou.

Să presupunem că avem mai multe pagini în mod logic document aferent, care trebuie digitizat și trimis prin e-mail către contrapartida noastră. Să-i spunem „Contract”.

În iubitul nostru Windows XP, există un „Asistent scaner sau cameră digitală” standard. Pentru ca expertul să funcționeze, scanerul trebuie să fie instalat pe computer și trebuie să fie activat. Lucrul în vrăjitor este foarte simplu și există un mic ghid în lecția Digitalizarea documentelor în Windows XP.

În Windows 7, instrumentul pentru crearea de copii electronice ale documentelor și imaginilor tipărite este componenta standard Windows Fax and Scan.

Deci, am citit lecțiile și cu ajutorul unuia dintre aceste programe am primit fișiere scanate ale paginilor contractului nostru într-una din formate grafice, salvate și atașați-le la un e-mail, trimiteți-le la adresa.

Lucrul rău aici este că atunci când scanăm un document cu mai multe pagini cu aceste programe, nu vom putea combina scanările de pagini într-un singur fișier. Bineînțeles, puteți numerota fișierele de pagină în ordine și arhivați-le astfel încât să le puteți trimite compact. Dar destinatarul nostru va putea vizualiza paginile pe rând doar într-un editor grafic, fără a putea naviga prin document. Este incomod și pierde timpul. Și în general inacceptabil.

De fapt, folosind aceste instrumente, obținem fotografii digitale individuale ale paginilor unui document.

Pentru a converti scanările noastre împrăștiate în un singur document cu posibilitatea de căutare full-text, aveți nevoie de un program de recunoaștere a textului. Cel mai bun pentru astăzi este FineReader.

FineReader este un program firma ruseasca ABBYY. Cea mai recentă versiune ABBYY FineReader 12 a fost lansată în februarie 2014. Acest program extrage date text din imagini digitale - recunoaște caracterele text. Versiunea de evaluare a ABBYY FineReader 12 Professional poate fi descărcată din resursa oficială: http://www.abbyy.ru/finereaderși antrenează-te timp de 30 de zile.

Este mai bine când una dintre cele mai recente versiuni pro este instalată pe computer. Aici și mai jos, este descrisă lucrul în ABBYY FineReader 10 Professional Edition.

Așadar, în lecțiile anterioare, am scanat paginile cu instrumente standard Windows, le-am numerotat, le-am salvat cu extensia „jpg” și le-am plasat într-un folder separat, pe care l-am numit „Acord”.

Deci, folosind funcțiile minunate ale programului de recunoaștere, putem converti cu ușurință diverse imagini în formate editabile.

Mai multe despre aceasta, vă rugăm, în următoarea lecție: Scanarea în ABBYY FineReader.

Și așa, citim aceste lecții și vedem ce avantaje ne oferă programul de recunoaștere. În loc de tastarea plictisitoare și consumatoare de timp dintr-o carte sau broșură, pur și simplu scanăm paginile necesare cu FineReader, le edităm dacă este necesar și le salvăm în formatul selectat. Astfel, puteți compune rapid, de exemplu, un articol sau un rezumat .

Și cum să scanăm paginile cărților și să digitizăm cărțile citim în subiectul: Digitizing a book.

În concluzie, să rezumam subiectul: un scaner în combinație cu un program de recunoaștere este un înlocuitor rațional pentru tastarea de la tastatură. Având o versiune pe hârtie - un text tipărit pe o imprimantă sau într-o tipografie, în loc să intrăm de la tastatură, îl scanăm pur și simplu. O altă zonă populară de aplicare a scanerului este digitizarea unei varietăți de produse tipărite - etichete, cărți poștale, fotografii, reviste, cărți.

Digitalizarea documentelor este conversia documentelor în formă digitală. Puteți digitiza desene, texte și cărți. Activitatea oricărui birou sau instituție obișnuită, mai devreme sau mai târziu, duce la formarea în interiorul zidurilor sale sumă uriașă documente. Documentele sunt depozitate pe rafturi și în sertarele biroului. Ele ocupă o cantitate imensă de spațiu în dulapurile de birou și pe birourile angajaților de birou. Munți de documentare, care este foarte greu de înțeles și este aproape imposibil să găsești rapid unul sau altul. Pentru ca biroul să nu se transforme într-un depozit de arhivă de documente, iar angajații săi pot lucra rapid cu oricare documentatia necesara, trebuie să digitalizați toate documentele disponibile la companie și să le transferați de pe hârtie în format electronic, folosind serviciile de scanare și recunoaștere a documentelor. Documentele electronice sunt mult mai ușor de procesat și stocat. Nu ocupă mult spațiu în birou. Acestea nu pot fi pierdute sau deteriorate, iar găsirea unui document într-o arhivă electronică digitizată, unde totul este sistematizat și sortat în mănunchiuri este mult mai ușoară decât într-o grămadă uriașă de hârtie depozitată într-un dulap de birou. Documentele digitizate sunt convenabile pentru utilizare și în cazul în care un angajat al companiei pleacă într-o călătorie de afaceri sau pentru negocieri. O mica unitate flash in buzunar este capabila sa contina intreaga arhiva a documentelor companiei si ii va oferi posibilitatea, daca este cazul, de a gasi rapid orice document necesar. Este foarte convenabil și practic să folosiți documente digitizate, în timp ce serviciile de digitizare a documentelor nu sunt suficient de costisitoare și sunt disponibile nu numai pentru marile corporații, ci și pentru firmele mici și organizațiile bugetare.

Digitalizarea desenelor

Digitalizarea desenelor, sau așa cum se mai numește și vectorizare, vă permite să transferați desene tehnice și arhitecturale de pe hârtie în format electronic. Serviciile de digitalizare a desenelor pot simplifica și sistematiza în mod semnificativ sistemul de arhivare a documentației de proiectare și sunt foarte relevante atât pentru întreprinderile industrialeși institute științifice, precum și pentru birourile de arhitectură și proiectare, arhitecți privați, studenți și oricine, după specificul muncii sau studiului lor, lucrează cu desene. De regulă, principala problemă a arhivării documentației de proiectare este căutarea desenului dorit, condițiile în care desenul imprimat pe hârtie Whatman ar trebui să fie păstrat și volumul acestuia. Digitalizarea desenelor poate rezolva eficient aceste probleme. Când un desen, datorită digitizării, este transferat din suport de hârtieîn format electronic, pentru stocarea acestuia nu este necesar să existe suprafețe mari de arhivă, ci este suficient doar o cantitate mică de spațiu liber pe hard diskul unui computer sau al oricărui alt suport electronic. În același timp, este suficient să sistematizați o dată conținutul arhivei, descompunând desenele digitizate în dosare tematice, iar ulterior este ușor să găsiți orice desen necesar. Desenele stocate în arhiva electronică nu sunt supuse solicitărilor mecanice sau influenței oricăror alte forțe și elemente naturale. Nu pot fi umezite, rupte sau pierdute, iar datorită sistemului de rezervă, vă puteți proteja sută la sută de pierderea sau pierderea lor. Lucrul cu desene digitizate este mult mai ușor decât cu omologii lor de hârtie. Este mult mai convenabil să purtați cu dvs. un disc laser, pe care aveți întotdeauna acces la întreaga arhivă, mai degrabă decât volume de hârtie mari și desene incomode. Da, și arătați desenul clientului, unde este mai convenabil pe monitorul unui computer sau laptop, dar fără a desface hârtie de desen multimetru pe masa lui. Ca să nu mai vorbim că desenul digitizat poate fi pur și simplu trimis prin e-mail, economisind în același timp atât timpul dvs., cât și timpul celui căruia i-a fost destinat acest desen. Astăzi, multe companii oferă servicii de digitizare a desenelor și ne face plăcere să afirmăm faptul că compania noastră este unul dintre liderii în domeniul digitizării documentelor. Până în prezent, dispunem de toate echipamentele și programele necesare pentru a asigura digitizarea oricărui desen cu păstrarea completă detaliată a calității acestuia.

Digitalizarea textelor

Digitalizarea textelor este o metodă de conversie a textului tipărit de pe hârtie în format electronic. Digitalizarea textelor este indispensabilă ca instrument convenabil pentru crearea arhivelor electronice și ca instrument pentru convertirea cărților și manualelor în format electronic. Acum iubitorii de cuvânt literar nu trebuie să stea ore în șir în biblioteci sau să poarte o carte grea și incomodă. Este suficient să ai o tabletă electronică care să încapă cu ușurință în buzunar sau în poșetă și să citești orice literatură de ficțiune sau de referință.

Digitalizarea cărților

Digitalizarea textului vă permite să transferați o carte de orice dimensiune în format digital. Este foarte convenabil și practic. Pe lângă ușurința în utilizare, merită menționat beneficiile economice evidente. Departe de a fi întotdeauna, poți cumpăra pentru tine cutare sau cutare manuală sau carte și, în același timp, o poți împrumuta de la bibliotecă sau de la un prieten și, datorită serviciului de digitizare, devii proprietarul versiunii electronice, cheltuind mult mai puțin bani pentru asta decât cu cumpărarea unei cărți. De asemenea, digitalizarea cărților a simplificat foarte mult procesul de stocare a manuscriselor rare și a cărților cu valoare istorică. La urma urmei, hârtia nu este eternă, dar versiunea electronică a cuvântului tipărit poate fi într-adevăr păstrată timp de mii de ani și nu își va pierde niciodată conținutul original, păstrând nu doar textul, ci și ilustrațiile pentru posteritate.

SCANARE: Tehnologii

Ce este digitizarea?

02.10.2015, vineri, 14:05, Msk 2707

Scanare, retroconversie și servicii conexe. Revizuirea tehnologiilor de conversie a documentelor în formă electronică.

Există mai multe opțiuni pentru organizarea proceselor de digitalizare. Acestea se pot desfășura în mod independent sau cu externalizarea serviciilor, cu exportul de documente sau cu efectuarea de lucrări pe teritoriul lor. La digitizare, pot fi folosite scanere de birou, de documente profesionale sau planetare. Datele pot fi extrase în mod manual, semi-automat sau automat, cu prelucrare preliminară arhivistică a documentelor pe hârtie sau clasificarea informațiilor deja în formă electronică etc.

Ce modalitate de a alege?

Solutia depinde de sarcina specifica, deoarece fiecare dintre „sau” de mai sus determină calitatea rezultatului și costul lucrării. De exemplu, întrebarea documentelor legate este eternă: este mai profitabil să scanezi încet într-o stare legată sau să cheltuiești bani pe cusături, dar să digitalizezi rapid pe scanere de documente?

Cel mai simplu mod de a alege calea care funcționează cel mai bine pentru dvs. este să căutați expertiza unei organizații de digitalizare. Interesat de muncă companii mari Ei vor efectua un sondaj gratuit și vor determina cea mai bună abordare pentru dvs. Nu ratați această oportunitate și nu vă așteptați să fiți tentat să comandați servicii: majoritatea acestor companii sunt, de asemenea, interesate să furnizeze hardware și software pentru digitizarea do-it-yourself.

Câte documente trebuie să scanezi?

Parametrul definitoriu este volumul documentelor.

Parametrul definitoriu este volumul documentelor. Pentru scanarea zilnică a pachetelor mici de documente brodate (de exemplu, contabilitate primară), este potrivit un scaner de birou obișnuit, care poate rezista la o încărcătură de câteva mii de pagini pe zi. Trebuie doar să îl completați cu un program convenabil de indexare.

Scanarea regulată a volumelor mari necesită echipament profesional. Acestea sunt scanere industriale care costă mulți bani (un astfel de echipament este folosit de Serviciul Federal de Taxe, Serviciul Vamal Federal și băncile mari). Prin urmare, un acord-cadru pentru furnizarea de servicii periodice de digitalizare poate fi o alternativă mai puțin costisitoare.

Conversia marilor retrospective mari în formă electronică pe cont propriu nu este justificată din punct de vedere economic: pe lângă achiziționarea de echipamente și formarea angajaților, vor fi necesare costuri semnificative de muncă și timp. Cu siguranță este mai eficient să comanzi un serviciu, deoarece o companie mare poate aloca un personal mare și poate rezolva problema rapid.

Unde să scanezi documentele?

Parametrul definitoriu este cererea de documente scanate. Sechestrarea documentelor afectează activitatea organizației la momentul scanării? Acest lucru este deosebit de critic atunci când se digitalizează documente care sunt accesate în mod regulat de angajați sau care pot fi solicitate brusc de autoritatea de reglementare, precum și pentru eliminarea urgențelor asociate documentelor. Exemple: financiare și documentele de personal, documentația tehnică și operațională, registrele oficiului de registratură și alte fonduri din industrie.

Zona de scanare, organizata in sediul firmei-client de servicii.

Dacă trebuie să le digitalizați suficient de repede, atunci abordarea tradițională este să comandați servicii odată cu plecarea echipei de scanare pe teritoriul dvs. Adesea, acest lucru se dovedește a fi mai ieftin decât livrarea documentelor către producția antreprenorului și înapoi, dar totul este determinat de distanța teritorială. Reglementările de lucru pe teren înseamnă scanarea cazului emis în termen de una sau două zile lucrătoare, fără o retragere îndelungată din fluxul de lucru.

Ar trebui să brodez documente?

Parametri determinanți: starea documentelor și posibilitatea de cusătură. Dacă există o astfel de oportunitate și hârtia este potrivită pentru tragerea cu un scanner de documente, atunci ar trebui să fie brodata. Faptul este că scanarea documentelor legate pe un scaner planetar (cărți) este de câteva zeci de ori mai lentă decât digitalizarea în flux. Creșteți proporțional timpul de muncă și costul forței de muncă. Scanarea pe scanere de documente, chiar și ținând cont de îmbinare, este mai rapidă și mai ieftină.

Te poți broda singur, sau poți încredința asta artistului.

Puteți broda singur, sau îl puteți încredința antreprenorului: dacă se alege o firmă de renume, nu trebuie să vă fie teamă să pierdeți documentele. Dimpotrivă, reglementarea strictă a tuturor proceselor și materialele de înaltă calitate permit companiilor să se asigure împotriva pierderilor financiare suplimentare și a daunelor aduse imaginii lor. Această abordare este chiar de încredere tribunalele ruse: la organizarea scanării, de obicei printr-un ordin intern, este permisă îmbinarea și îmbinarea ulterioară a dosarelor judecătorești.

Apropo, marile companii pot efectua simultan procesări profesionale de arhivă: în primul rând, o parte a lucrării este deja făcută în pregătirea pentru scanare, iar în al doilea rând, procesarea arhivă ajută la identificarea documentelor nerevendicate și la reducerea volumului matricelor scanate, ceea ce poate reduce costul muncii.

Ce calitate sa alegi?

Astăzi, orice obiect poate fi scanat cu o calitate înaltă: de la o carte mică de bibliotecă la carduri 8A0 și peisaje de teatru.

Parametri determinanți: tipul documentului și cantitatea de resursă primită în formular electronic. Astăzi, echipamentele de scanare pot produce imagini cu rezoluții cuprinse între 200 și 1200 de puncte pe inch (dpi). Pentru lucrările artistice, se utilizează de obicei o rezoluție de 400-600 dpi, ceea ce vă permite să creați reproduceri de înaltă calitate. Mai mult calitate superioară folosit numai atunci când este necesar să măriți imaginea și să detaliați obiecte mici, cum ar fi monede.

Desenele detaliate și cu contrast redus, realizate adesea pe hârtie de calc și albastru, trebuie scanate la o rezoluție de 300-400 dpi și procesare suplimentară a imaginii în editorii grafici. Restul documentelor sunt de obicei scanate la 300 dpi, ceea ce este suficient pentru a imprima copii fără a pierde calitatea. Decuparea imaginilor necesare, corecția geometrică, corecția culorilor, conversia în formate pdf, tiff, jpeg etc. pot fi efectuate într-un mod complet automat prin programele încorporate în echipamentul de scanare sau furnizate împreună cu acesta.

În cele mai multe cazuri, este utilizat modul de fotografiere color. Acest lucru este necesar pentru toate documentele care au fost corectate sau ștampilate peste text, pentru a verifica dacă a fost luată o copie electronică din documentul original cu sigiliu și semnătură, precum și pentru lizibilitatea textelor decolorate și pentru a transmite caracteristicile unice ale originalul. Necesitatea scanării color a lucrărilor artistice nu este discutată. Modul „scale de gri” este utilizat doar în unele cazuri: când documentele nu conțin atribute de culoare sau când este necesară reducerea volumului resursei electronice primite.

Scanarea poate fi efectuată independent. Sarcina principală este de a instrui angajații să lucreze corect cu echipamente complexe, deoarece calitatea imaginilor rezultate este importantă pentru indexarea ulterioară: un document scanat prost, umbrele, flare și alte defecte ale unei imagini electronice pot face ca informațiile importante să nu fie citite. Acest lucru va împiedica aplicarea tehnologiilor de extragere automată a datelor și poate duce la erori de indexare. Încărcarea datelor eronate pe unele sisteme ( registrele de stat, sisteme contabile) nu este permisă.

Indexarea

Scanarea simplă este rar utilizată, deoarece în lucrările ulterioare va fi doar puțin mai ușor să căutați informații într-un set de fișiere grafice prin întoarcerea hârtiei. Pentru a putea căuta, este necesar să selectați mai multe atribute (câmpuri de index) în document.

Angajații implicați în indexarea în masă a documentelor prin introducere manuală.

Atributele selectate pot fi adăugate la numele fișierului. Această practică s-a dezvoltat în instanțele ruse: pentru ca operatorul de scanare să nu aibă acces la sistemele interne ale instanței, la digitalizare, toate detaliile necesare sunt introduse în numele fișierului. Ulterior, aceste detalii sunt recunoscute de sistemul judiciar la încărcarea fiecărui document separat.

Dar, de obicei, documentele digitizate sunt încărcate în Sistem informatic grup, care necesită crearea unei baze de date. Deci, dacă trebuie să atașați un document la un card deja existent în sistemul contabil, este suficient să extrageți câteva detalii care îl definesc în mod unic - de obicei un număr și o dată.

Dacă este necesar să se formeze o bază de căutare pe baza documentelor în sine, atunci cantitatea de date care trebuie extrasă este determinată de sarcină: de la câteva detalii pentru căutarea unui fișier într-o arhivă electronică până la transferul tuturor informațiilor semnificative într-un proces analitic. baza de date (nume complet, adrese, TIN, KPP, date, numere de documente de aplicare etc.).

Muzeele, bibliotecile și arhivele își aplică propriile reguli de indexare atunci când digitalizează unitățile de depozitare și documentele contabile. O zonă separată de servicii este, de asemenea, vectorizarea, care este utilizată, în special, în digitizarea benzilor de înregistrare (automate) și a desenelor (redare manuală în sistemele CAD).

Câte date de extras? Răspunsul la această întrebare se obține cel mai bine folosind expertiza, deoarece numărul de detalii care trebuie extrase depinde de sarcina funcțională și determină în mare măsură costul digitizării. În unele cazuri, vă puteți limita la colecții de documente, atunci când imaginile electronice sunt combinate sub auspiciile documentului principal (de exemplu, un contract sau un registru de conturi). În altele, este necesară extragerea tuturor datelor cuprinse în document pentru a completa fișa sistemului informatic.

Exemple de recuperare a datelor

Analiza comenzilor plasate pe portalul zakupki.gov.ru de companii cu participarea statuluiși instituțiile statului (44-FZ, 223-FZ), arată că:

- Pentru a lega copiile electronice ale ORD la sistemul electronic de gestionare a documentelor, numărul, data și tipul documentului sunt suficiente.

– Scanarea documentației financiare este adesea însoțită de extragerea numărului, datei, numelor și detaliilor plătitorilor, sumelor.

– Digitalizarea documentelor de arhivă ale municipiilor (decrete ale administrațiilor, comitetelor executive orășenești, consilii sătești etc.) în vederea prestării serviciilor și inventarierii obiectelor de raporturi funciare și de proprietate necesită extragerea numărului și datei documentului, a tuturor numelor complete și adreselor; . Mai mult, adresele trebuie comparate cu directoarele KLADR/FIAS actuale.

– Digitalizarea documentelor Fondului de arhivă al Federației Ruse este însoțită de completarea strictă a ANS și descrierea fondurilor în conformitate cu legislația arhivistică.

– Indexarea inventarelor și registrelor presupune recunoașterea tuturor înregistrărilor ordinale.

– Pentru a lucra cu desene în formă electronică, este necesar să extragi aproape toate câmpurile de timbre.

– Scanarea cazurilor compozite necesită nu numai extragerea detaliilor fiecărui document, ci și stabilirea de relații. Cel mai dificil caz este documentația de proiectare, în care baza de date generată are o ierarhie pe mai multe niveluri și legături de documente.