Prevod archívnych dokumentov do digitálneho formátu. Skenovanie archívu: ako sa digitalizujú archívne dokumenty

Digitalizácia papierové archívy zahŕňa skenovanie a katalogizáciu dokumentov. Čím väčšia je organizácia, spoločnosť, tým zložitejší je tok dokumentov, tým viac dokumentov je uložených v jej archívoch a služby na digitalizáciu archívov preto vyzerajú atraktívnejšie.

Úspora pri vyhľadávaní

  1. Často na archiváciu požadovaný dokument vyžaduje to veľa času a úsilia. Alebo môže nastať situácia, keď ten istý doklad vyžaduje viacero zamestnancov naraz – v tomto prípade si musíte vyhotoviť jeho kópiu.
  2. Okrem toho stojí za zmienku, že častý prístup k papierovým dokumentom skôr či neskôr vedie k ich poškodeniu a niekedy aj „strate“, ak sú prípady omylom vložené do archívu.
  3. Vyriešenie všetkých týchto problémov je však celkom jednoduché – stačí zabezpečiť digitalizáciu papierových archívov, využívať pri svojej práci automatizované informačné systémy, ktoré zabezpečia promptné vyhľadávanie, ako aj prístup k elektronickým kópiám dokumentov.
  4. Digitalizácia papierových archívov má množstvo výhod. A to hovoríme nielen o kvalitatívne nových možnostiach poskytovania a využívania firemnej dokumentácie, ale aj o zaistení bezpečnosti týchto informácií.

Výhody digitalizovaných dokumentov:

  • zníženie zaťaženia papierového archívu a priestoru na kopírovanie;
  • možnosť uvoľnenia archívneho priestoru;
  • zníženie nákladov na údržbu papierových archívov.

Digitalizácia papierových archívov: etapy

Prvé štádium. Všetky práce na digitalizácii archívov začínajú skúmaním dokumentov. V dôsledku analýzy dokumentov sa určuje štruktúra poľa papiera, ako aj kvantitatívne a kvalitatívne charakteristiky Dokumenty. Na základe výsledkov skúmania sa vykonáva výber technológie a digitalizácie dokumentov, kritériá hodnotenia kvality, výber zloženia zariadenia, dohodnuté termíny realizácie a rozpočet.

Druhá fáza je priame skenovanie. Digitalizácia archívov je proces vytvárania grafických obrazov dokumentu pomocou skenerov. Pred prevodom dokumentu do elektronickej podoby operátor zvolí optimálny režim skenovania, v skutočnosti vykoná skenovanie, pričom kontroluje kvalitu výsledných obrázkov na monitore.

Efekt zavedenia elektronického archívu

Výsledkom digitalizácie papierových archívov sú elektronické kópie dokumentov. Profesionálne vybavenie, ktoré naša spoločnosť používa, umožňuje skenovanie rôzne dokumenty rýchlosťou až niekoľko tisíc strán za deň - v dávkovom režime. Výsledné súbory sa zapisujú na flash disky, CD, DVD a iné médiá.

Archív výsledkov digitalizácie

Ihneď po dokončení digitalizácie archívov prechádzajú grafické obrázky automatizovaným spracovaním – rozdeľovaním na strany nátierok, orezávaním po okrajoch, zarovnávaním podľa čiar, odstránením šumu, zlepšením kvality obrázkov a pod. Parametre katalogizácie naskenovaných dokumentov si môžete nastaviť podľa vlastného uváženia, čím zabezpečíte optimalizáciu obchodných procesov zo strany správy dokumentov.

V súčasnosti sa čoraz väčšia pozornosť venuje problematike o kultúrny majetok. V tomto smere je schválený vládne programy, v rámci ktorých, podľa zámeru ich tvorcov, využitie nových technológií, inovatívnych prístupov, ako aj svetových skúseností zabezpečí bezpečnosť kultúrne dedičstvo, historicky významné dokumenty. Preto dnes ruské archívy konvertujú papierové dokumenty do elektronickej podoby. O tom, aký bol začiatok tejto rozsiahlej práce, s akými ťažkosťami sa archivári stretávajú a ako riešia otázky uchovávania digitalizovaných dokumentov, zástupca vedúceho Federálneho archívneho úradu (Rosarchive) Oleg Naumov povedal korešpondent PC Week/RE Oľga Zvonarevová.

PC Week: Povedzte nám, prosím, ako sa začal proces digitalizácie archívnych dokumentov, aké sú vlastnosti tejto práce?

Oleg Naumov:Úloha hromadnej konverzie archívnych dokumentov do elektronickej podoby bola stanovená v programe Informačná spoločnosť (2011-2020). Nie je to vôbec ľahká úloha. Navyše, jedna vec je digitalizovať dokumenty a druhá vec je digitalizovať vedecký referenčný prístroj(NSA), bez ktorých sa nedá nájsť požadovaný dokument. Preto, keď pred dvoma rokmi možnosť normálneho financovania prác v rámci spol cieľový program„Kultúra Ruska 2012-2018“, v prvom rade sa začali vytvárať v v elektronickom formáte NSA, čo vám umožní efektívne vyhľadávať dokumenty.

PC Week: Čo softvér používa sa na to?

ON.: Dlho pred prijatím programu „Informačná spoločnosť“ začal federálny archív vyvíjať celoruský štandardizovaný softvér na organizáciu účtovníctva dokumentov – softvérový balík „Archívny fond“. proprietárny systém Ruská federácia, zavedené na úrovni federálnych, krajských a mestských archívov. S jeho využitím bol vytvorený centrálny akciový katalóg umiestnený na portáli Archives of Russia. Archívny fond bol pôvodne vytvorený ako účtovný aparát, no potom sa začal využívať ako vyhľadávací aparát. V súčasnosti mnoho archívov používa špecializované vyhľadávacie nástroje.

PC Week: Aké archívne skúsenosti boli zásadné pri digitalizácii inventárov?

ON.: Ruský štátny historický archív v Petrohrade ako prvý zdigitalizoval všetky súpisy, a to výlučne vzhľadom na okolnosti. Keď vyvstala otázka o jeho presťahovaní, inventáre boli naskenované a ich elektronické obrázky boli použité vo všetkých fázach sťahovania, to znamená, že každá krabica, každý prípad bol sledovaný.

Bola to dobrá skúsenosť, no z pohľadu rozvoja informačných technológií nie veľmi úspešná. Hoci bolo možné sa s nimi zoznámiť v čitárni a online, zber grafických obrázkov neumožňuje automatizované vyhľadávanie. Tam, kde väčšie pohodlie používateľom poskytujú inventáre preložené do databázového formátu, s možnosťou jednoduchého aj pokročilého vyhľadávania. Rosarchiv začal tieto práce aktívne financovať. K dnešnému dňu je vykonaných asi 20 – 30 % súpisov federálnych archívov.

PC Week: Akým výzvam čelia archívy pri digitalizácii dokumentov?

ON. Prvým problémom je samotný objem. Celkový objem Archívny fond Na Ruskú federáciu pripadá 494 miliónov spisov, z ktorých 9 % je vo federálnych archívoch.

Najťažšie je však určiť, ktoré dokumenty by sa mali digitalizovať. Najjednoduchšia odpoveď je najhľadanejšia. A ako určiť túto požiadavku? Dnes potrebujeme jednu vec, zajtra druhú. A v Sovietsky čas zaviedla sa koncepcia osobitne cenných archívnych fondov a dokumentov. Vytvorili poistný fond na mikrofilme, ako aj fond na použitie. Dnes však tieto dokumenty prakticky nie sú žiadané. To znamená, že kritériá pre hodnotu a dopyt po dokumentoch sovietskej éry teraz vôbec nefungujú. Dopyt sa neustále mení. Je takmer nemožné s istotou určiť, ktoré dokumenty budú najviac žiadané.

Dôležitá je aj technická stránka problému. Obrovský dopyt bol napríklad po zostavovaní vlastných rodokmeňov. Je to dobré a potrebné. Začali aktívne objednávať tieto prípady: farské matriky, revízne rozprávky. Ale absolútne nie sú prispôsobené na také masové použitie. Skenovať ich ako najobľúbenejšie je nezmysel. Z knihy hrubej 80 cm človeku stačí jedna strana. A na uspokojenie tejto požiadavky musíte naskenovať celých tisíc strán. Áno, aj s obratom. Ale na druhej strane, ak sú tieto dokumenty naskenované, potom sú originály stiahnuté z obehu a je zaručená ich fyzická bezpečnosť. Všetky sú jedinečné. A čo je najdôležitejšie, nešťastní správcovia (vrátane mnohých žien) nebudú nosiť všetky tieto tony papierov v náručí.

Tu však narážame na formu poskytovania informácií. Koniec koncov, pre používateľa bolo oveľa zaujímavejšie získať nie obrázok, ale dešifrovanie a databázu. A množstvo týchto dokumentov je obrovské. Len v RGADA vo fonde 350 "Landratských kníh a revíznych kníh" - viac ako päťtisíc prípadov, asi 3 milióny strán. Koľko ľudí treba zapojiť? V Perme našli dobré východisko: prilákali financie, ktoré boli pridelené na zabezpečenie pracovných miest. Prácu vykonávali ľudia doma. Úspešne vyriešil problém nezamestnanosti. A nakoniec sa im podarilo to, čo nikto iný v Rusku, na moju pamiatku, nedokázal.

Skúsenosti so skenovaním vo federálnych archívoch nám umožňujú vyvodiť dva závery. Po prvé, vytvorenie elektronického fondu používania bez vytvorenia NSA je neproduktívne zamestnanie. Ukáže sa obrovská hromada skenov, kde nie je možné nájsť ten správny. Po druhé, skenovanie, najmä hromadné, je účelné na odhalenie dokončených komplexov - fondov alebo zásob. Prípady by sa zároveň mali skenovať celé, aby sa predišlo konfliktom v prípade chýb v číslovaní. V jednotlivé prípady, vzhľadom na jedinečnosť a význam dokumentov, bez ohľadu na to, či je na zadnej strane hárku text alebo nie, je potrebné hárok vrátane zadnej strany digitalizovať. Potom mizne otázka, že sme možno niečo skryli.

Problém je s výberom vybavenia. Niekde potrebujete jednoduchý skener, niekde by to malo byť komplikovanejšie. Napríklad na digitalizáciu landratských kníh bola špeciálne objednaná „hlboká kolíska“. V opačnom prípade nekopírujte, pretože hrúbka chrbta niektorých kníh dosahuje 80 cm.

PC Week: Čo je hlavným cieľom digitalizácie v súčasnosti?

ON. Sú tri. Prvým je rozšírenie a zjednodušenie prístupu k dokumentom Archívneho fondu. Druhým je zaistenie bezpečnosti originálov ich stiahnutím z obehu a poskytnutím prístupu do elektronického fondu použitia. Tretím je zjednodušenie poskytovania verejných služieb. Teraz existuje veľa individuálnych žiadostí občanov o dokumenty o personáli. Archívy ich tiež začínajú digitalizovať a na prípravu odpovedí využívajú elektronické kópie, čo značne urýchľuje prácu.

PC Week: Ako archívy digitalizujú dokumenty?

ON. Proces prebieha inak: niekde to robia sami, pomocou improvizovaných prostriedkov alebo získania rôznych zariadení. Druhým spôsobom je zapojenie externých organizácií. Stále však neexistuje jednoznačná odpoveď na najdôležitejšiu otázku: o čo sa snažíme digitalizáciou dokumentov?

PC Week: A nikto sa ich nepýta?

ON. Prečo, pýtajú sa všetci. Ako však nájsť jedinú správnu odpoveď? Samozrejme, výhoda používania digitalizovaných dokumentov je zrejmá. Toto a bezpečnosť a vzdialený prístup a jednoduchosť poskytovania informácií a jednoduchosť vytvárania kópií - celý rad plusov. Ďalšia vec je, ako to dosiahnuť? Tu ste používateľom, vstúpili ste na stránku a zistili ste, že dokumenty, ktoré potrebujete, sú uložené. Povedzme v Perme. Išli sme na stránku odkazom, našli sme popisy prípadov. Je tu zaujímavá záležitosť. A ako ho získať? No ak je to už zdigitalizované. A ak nie? Ísť sám do archívu a objednať si originály? Alebo by mal archív digitalizovať všetky prípady? Ale toto je neskutočné. Takže vlastne zostáva len jedna možnosť. Vytvorenie možnosti rýchlej výroby elektronických kópií v každom archíve na žiadosť používateľa. A nemusí to byť vaša vlastná jednotka. Môže ísť aj o outsourcing. Takáto služba však musí byť poskytnutá okamžite. Ale robiť tieto kópie, ako ukazujú skúsenosti, má zmysel iba vtedy, keď už existujú elektronický systém, čo umožní kvalitné a štruktúrované umiestnenie týchto materiálov. Vtedy to bude fungovať. Kedy sa nám to podarí a či sa nám to podarí, úprimne povedané, neviem.

PC Week: Pravdepodobne už pred schválením programu Informačná spoločnosť v roku 2010 boli práce na digitalizácii realizované?

ON.Áno. Boli samostatné projekty. Napríklad Elektronický archív Kominterny alebo zbierka listín od SVAG. Spravidla sa realizovali spoločne so zahraničnými partnermi. Vlastné prostriedky na ich realizáciu nestačili. Záležitosť nebola jednoduchá. Vyskytli sa technické, metodické, organizačné a technologické ťažkosti. Skúsenosti sa však hromadili. A teraz je to veľmi užitočné.

PC Week: To znamená, že po schválení programu začali určovať, aké by mali byť hlavné kritériá pre digitalizáciu dokumentov?

ON. Tento program, povedzme, umožnil archivárom upozorniť úrady na to, že existuje problém a treba ho riešiť. Pripraviť a schváliť programy digitalizácie. A prilákať na to financie. Ale dnes neexistuje žiadne univerzálne kritérium. Je ťažké definovať jednotný prístup pre každého, pretože archívy uchovávajú úplne odlišnú dokumentáciu.

PC Week: Takže každý archív vlastne definoval kritériá sám?

ON. Vlastne áno. V zásade sú to štyri kritériá, sú všeobecne akceptované, ale nebudem tvrdiť, že sú najsprávnejšie. Ide o dopyt po dokumentoch, zaistenie bezpečnosti, uľahčenie práce zamestnancov archívu, zlepšenie podmienok obsluhy používateľov. Navyše to urýchli prácu. Ak mám na svojej stránke elektronický NBÚ, používateľ príde do archívu pripraveného nahliadnutím do inventára na internete. Ak sú požadované dokumenty už zdigitalizované, má možnosť si ich pozrieť na svojom počítači bez toho, aby chodil do archívu, alebo ich bezodkladne dostať do čitárne.

PC Week: Ukazuje sa, že každý archív sa musí sám rozhodnúť, čo bude digitalizovať?

ON. Celkom správne. Toto by mal byť výlučne individuálny program pre každý archív. Nemôžete urobiť jeden. Závisí to od mnohých faktorov: od finančných možností, od stupňa rozvoja a implementácie IT technológií, od konkrétneho dopytu. Niekto je teda veľmi žiadaný o personálne dokumenty a je potrebné uspokojiť potreby občanov. Aj keď z archívneho hľadiska tieto dokumenty nie sú trvalé, ale majú dočasnú dobu uloženia 75 rokov. To ale uľahčuje prácu a pomáha ľuďom, pretože človek nečaká na odpoveď na žiadosť mesiac, ale požadované informácie dostane do dvoch dní. Preto je potrebné investovať do tohto úsilia a zdrojov.

PC Week: Pri určovaní priorít dokumentov, ktoré sa majú digitalizovať, ich archívy koordinujú s ruskými archívmi?

ON. Ak hovoríme o regionálnych archívoch, tak nie. To je vecou každého archívu. Posielajú nám svoje programy informatizácie a digitalizácie. Poznáme ich a poradíme. Pomáhame im, ako najlepšie vieme, prideľujeme prostriedky z FTP. Ďalšia vec sú federálne archívy. Tu má rozhodujúci význam postavenie Ruského archívu. Ale ani tu neexistuje univerzálne kritérium. Na uspokojenie neustále sa zvyšujúceho dopytu po genealogických informáciách vyčlenil Ruský archív viac ako 40 miliónov rubľov. na prevod landratových kníh uložených v RGADA do elektronickej podoby. V reakcii na neustály záujem spoločnosti o históriu našej vlasti v nedávnej minulosti bola v júni tohto roku spustená stránka „Dokumenty sovietskej éry“, kde sú obrázky dokumentov z osobného fondu IV. Stalina a politbyra r. sú vyslaní ústredný výbor. Boli pripravené internetové projekty venované 1150. výročiu ruská štátnosť, 400. výročie ukončenia Útrap, 200. výročie Vlastenecká vojna 1812. Prirodzene, boli tam umiestnené obrázky najdôležitejších a najobľúbenejších dokumentov.

PC Week: V čitárni archívu sa teda teraz budú vydávať len elektronické kópie a nie originálne dokumenty?

ON. V ideálnom prípade potrebujete osobu, ktorá na stránke nájde dokument, ktorý hľadá, objedná si puzdro a dostane naskenované dokumenty. A originál zostáva nedotknutý. Sú však prípady, kedy potrebujete vidieť originál. Napríklad, bez ohľadu na to, aká dobrá je technika, neprenesie vodoznaky. A na nich môžete nastaviť dátum dokumentu. Ale takýchto prípadov je jeden z tisíc.

PC Week: Ukázalo sa, že archív bol poskytnutý používateľovi verejná služba, ale po digitalizovanej kópii dokumentu je potrebné uložiť?

ON. To je samozrejme výhoda skenovania. Predtým existovali mikrofilmy, xerox, strojopis. A archivár, ktorý urobil kópie, ich dal používateľovi. To znamená, že nemal kópiu dokumentu. V prípade digitalizácie zostáva kópia. Miesto skladovania by však malo byť jasne definované. A ak sa neskôr objaví druhá žiadosť, nebude potrebné prípad otvárať. V takejto práci musíte získať skúsenosti.

PC Week: Ako sa určujú termíny na digitalizáciu polí dokumentov?

ON. Termíny závisia od troch dôvodov: od technických a finančných možností a od stavu dokladov. Existujú dokumenty, ktoré sú zviazané tak, že ani najmodernejšia technika nedokáže plnohodnotne získať text. To znamená, že budú musieť byť vyšívané, čo sa nepáči ani dokumentom, ani archivárom. skenovať. Potom šiť späť. Zaberie to čas. Podmienky tiež závisia od objemu prípadov, od počtu listov v nich. Naskenovať stoh papierov v štandardnom formáte nie je až také náročné, no kartička 3x8 m je už náročnejšia. Podľa účtovných dokladov ide o jeden list. Ale skenuje sa len po častiach. A potom v softvéri musíte všetko „zošiť“, upraviť a uvidíte, ako bude tento dokument vyzerať.

PC Week: Ako prebieha práca na implementácii 89. bodu federálneho cieľového programu „Kultúra Ruska (2012-2018): tvorba archívnych elektronických zdrojov a ich poskytovanie na internete“?

ON. V rámci realizácie tejto položky prebieha digitalizácia inventára. Digitalizujú sa aj dokumenty vrátane landratských kníh. Okrem toho sa snažíme pomôcť aj regiónom: do tohto programu zahrnieme asi päť alebo šesť regiónov ročne a pridelíme 10 až 15 miliónov rubľov. Vytvárame online výstavy atď. Celkovo je na realizáciu prác v rámci tohto programu ročne pridelených 67 miliónov rubľov.

PC Week: Závisí rozdelenie financií od stupňa dôležitosti a významu dokumentov?

ON.Áno. Archívy predkladajú žiadosti o účasť v určitej forme, tieto žiadosti berieme do úvahy. Prihlasujú sa aj firmy, ktoré veria, že ponúkajú zaujímavé veci. Zvažujeme ich, vyberáme zaujímavé sľubné riešenia, zostavujeme všeobecný plán a realizujeme nákupy na konkurenčný základ. Vlani bolo na toto podujatie uzatvorených 52 štátnych zákaziek. To znamená, že každý týždeň sme podpísali zmluvu.

PC Week: Dotkli ste sa témy dokumentov už uložených v archívoch od 11. storočia, no do archívov prichádzajú aj nové papierové dokumenty, ktorých je obrovské množstvo. Ako sa s nimi pracuje? Ako sa rieši otázka ich digitalizácie?

ON. Pre nás je dôležité len jedno: či tieto dokumenty patria do zloženia archívneho fondu alebo nie. To znamená, že podliehajú alebo nepodliehajú trvalej trvanlivosti. A potom je z hľadiska použitia úplne jedno, či ide o dokumenty 11. alebo 21. storočia. V tomto smere sú si rovní. Ďalšia vec je, že máme prirodzene poistný fond a fond použitia dokumentov z 11. storočia. A tieto jedinečné dokumenty sa rozdávajú veľmi zriedka. Existuje špeciálny štátny register jedinečných dokumentov Ruskej federácie, ktorý je zverejnený na webovej stránke Federálneho archívu a obsahuje ich popisy a elektronické obrázky.

PC Week: Je v tomto smere jednoduchšie akceptovať na uloženie dokumenty preložené do elektronického formátu? Napríklad vstúpili do platnosti zmeny v legislatíve týkajúcej sa personálnej dokumentácie a archívy ju pravdepodobne môžu akceptovať v elektronickej podobe?

ON. Myslím že áno. Štátnemu archívu ale nemá zmysel brať dobové dokumenty momentálne žiadny personál. Za čo? Vypočítajte si dôchodok? existuje Dôchodkový fond, ktorá od roku 2000 zriadila špecializovanú evidenciu občanov.

PC Week: Takže archívy neakceptujú záznamy staré 75 rokov?

ON. Nie, držíme ho už dlho. A teraz aktívne rokujeme s tým istým dôchodkovým fondom, aby sme mohli skrátiť toto obdobie pre papierové dokumenty zo 75 na 15 rokov. Dôchodkový fond sa však obáva, že ich elektronický systém môže skolabovať.

A tie dokumenty, ktoré k nám časom prídu v elektronickej podobe, sú veľmi veľký a úplne samostatný problém. Toto sú otázky o elektronická správa dokumentov, elektronické dokumenty. Ako ich brať, ako ich skladovať, je samostatný problém.

PC Week: Ešte ste nedostali takéto dokumenty?

ON. Nie, robia. Materiály sčítania obyvateľstva a poľnohospodárskeho sčítania prijal GARF v elektronickej podobe. Ďalšia vec je, že tieto sčítania existujú len v elektronickej forme. K hromadnému prijímaniu obchodnej dokumentácie však zatiaľ nedochádza. Je tu pomerne veľa nevyriešených problémov.

PC Week: A čo dokumenty likvidovaných organizácií? Sú prijaté na uskladnenie?

ON. Schvaľujeme. Pravda, v prípade konkurzu a likvidácie firmy sú správcovia povinní nájsť peniaze na popísanie dokumentov likvidovaných organizácií, no nie vždy ich nájdu.

PC Week: Federal Archives spravuje 15 federálnych archívov. Regionálne archívy v v súčasnosti vyňaté spod kontroly vášho oddelenia?

ON.Áno, neexistuje nad nimi priama kontrola. Poslúchajú výkonné orgány subjekty federácie. Niekde ide o nezávislé archívne služby. Niekde sú, podobne ako my, zaradení na ministerstvách kultúry. Niekde - na ministerstvo spravodlivosti alebo priamo na úrad guvernéra. Ale vertikála moci, ktorá existovala v Sovietskom zväze a trvala do roku 2004, žiaľ, už neexistuje. Pokiaľ zachováme metodickú jednotu. Ako môžeme pomôcť regionálnym archívom. Zástupcovia spolkového archívu sa zúčastňujú každoročných podujatí, ktoré sa konajú v každom z nich federálny okres vedeckých a metodických rád. Raz ročne sa koná Archívna rada, kde sa schádzajú archivári z celej krajiny. To znamená, že spojenia zostávajú. Žartujeme, že archivár je povolanie, v ktorom sa v ktoromkoľvek meste ocitnete bez peňazí a vecí, prídete za kolegami archivármi a tí vás prijmú, nakŕmia a pošlú domov. Existuje bratstvo, ktoré v skutočnosti nie je charakteristické pre žiadne iné povolanie.

PC Week: Ďakujeme za rozhovor.

V kancelárii je často potrebné posielať kópie e-mailom – elektronické verzie tlačených dokumentov. Môžu to byť rôzne akty, faktúry, listy, zmluvy, listiny, kancelárske poznámky a všetky ďalšie možné dokumenty.

Doma máme staré fotografie, ktoré rokmi chátrali a chceli by sme si ich ponechať.

Dostali sme na chvíľu zaujímavú knihu, ale chceme ju mať pri sebe. Ako to všetko urobiť? Naše papierové dokumenty s krátkou životnosťou musia byť prevedené do elektronickej podoby, teda zdigitalizované a uložené.

Digitalizácia je prevod obrazu alebo analógového audio/video signálu do digitálneho formátu vhodného na záznam na elektronické médiá.

Na digitalizáciu obrázkov objektu existujú špeciálne zariadenia - skenery. Existujú skenery čiarových kódov, skenery filmov. Biometrické skenery čítajú vzor sietnice oka alebo papilárny vzor kože prstov. Tvar trojrozmerného objektu sníma trojrozmerný 3D skener.

V skeneroch na spracovanie papierových médií - kresby, fotografie, textové dokumenty, obraz je riadok po riadku osvetlený špeciálnou lampou a odrazený svetelný tok je zaostrený na fotocitlivú matricu. Analógovo-digitálny prevodník prevádza prijaté elektrické signály do binárneho dátového systému, ktorý tvorí digitálnu kópiu obrazu.

Výber skenera závisí od úloh a špecifík jeho aplikácie. Skener v kancelárii sa takmer vždy používa na digitalizáciu dokumentov. Aj keď sú fotografie naskenované, nepodliehajú v kancelárii vysokým požiadavkám na kvalitu. Rozlíšenie 300 dpi je dosť dostatočné na zabezpečenie presného fungovania rozpoznávacích programov a získanie dobrého čitateľný text. Každý dnes vyrobený skener poskytuje rozlíšenie prijateľné pre kancelársku prácu.

To platí aj pre farebnú hĺbku. Takmer každý moderný skener reprodukuje úroveň šedej farby potrebnú pre tlačené dokumenty.

Je to dôležité v kancelárii, kde je hlavnou úlohou rýchlo po stránke digitalizovať textové dokumenty, ide o automatizáciu procesu skenovania. Možno použiť hárkové skenery. Tu sa list dokumentu vloží do štrbiny zariadenia a ťahá sa, ako vo faxe, pozdĺž vodiacich valčekov. Takýto skener je pohodlný so vstavaným automatickým podávačom listov. Do zásobníka vložíme niekoľko listov viacstranového dokumentu a zatiaľ čo skener digitalizuje, súčasne robíme niečo iné. Všetko je tu jednoduché. Ak je nainštalovaný príslušný OCR softvér, stačí stlačenie jediného tlačidla na digitalizáciu a uloženie dokumentu v požadovanom formáte na takomto skeneri.

Moderným kancelárskym riešením pre oddelenie strojárskej firmy môže byť napríklad A3 skener, ktorý je súčasťou multifunkčného zariadenia spolu s tlačiarňou A3/A4. Na takomto MFP je vhodné digitalizovať a vytvárať kópie výkresov.

Je jasné, že skenovanie zviazaného časopisu alebo šírky knihy na hárkovom skeneri nebude fungovať.

Na skenovanie obojstranných dokumentov existujú duplexné skenery, kde dva skenovacie prvky spracujú obe strany hárku jedným prechodom.

Dobrým riešením pre domácnosť je farebná atramentová multifunkčná tlačiareň. MFP je multifunkčné zariadenie, ktoré obsahuje skener a tlačiareň. Takýmto zariadením je aj kopírka. To znamená, že MFP dokáže automaticky naskenovať dokument a vytlačiť jeho kópiu – vytvoriť fotokópiu dokumentu.

Kompaktné zariadenie s kombinovanými funkciami zaberie na stole menej miesta. Jeho náklady budú výrazne nižšie ako celkové náklady na zariadenia, ktoré sú v ňom zahrnuté, ak si ich kúpite samostatne. Na farebnej atramentovej tlačiarni vyrobíme kvalitné farebné fotografie a vizitky, plochým skenerom zdigitalizujeme dokumenty, fotoalbumy či potrebné knihy.

V nasledujúcich lekciách sa naučíme, ako ručne digitalizovať, konvertovať a ukladať textové dokumenty na plochom skeneri, stránku po strane.

V týchto príkladoch som na skenovanie použil populárnu stolnú multifunkčnú tlačiareň formátu A4. Takéto lacné zariadenie je najlepším riešením pre domácnosť a môže byť druhým doplnkovým multifunkčným zariadením v kancelárii.

Predpokladajme, že máme logicky viacstránku súvisiaci dokument, ktorý je potrebné zdigitalizovať a poslať e-mailom našej protistrane. Nazvime to „Zmluva“.

V našom milovanom systéme Windows XP je štandardný „Sprievodca skenerom alebo digitálnym fotoaparátom“. Aby sprievodca fungoval, musí byť skener nainštalovaný v počítači a musí byť povolený. Práca v sprievodcovi je veľmi jednoduchá a v lekcii Digitalizácia dokumentov vo Windows XP je malý návod.

V systéme Windows 7 je nástrojom na vytváranie elektronických kópií tlačených dokumentov a obrázkov štandardná súčasť Windows Fax and Scan.

Takže sme si prečítali lekcie a pomocou jedného z týchto programov sme dostali skenovacie súbory stránok našej zmluvy v jednom z grafických formátov, uložené a priložte ich k e-mailu, pošlite na adresu.

Zlé je, že pri skenovaní viacstranového dokumentu pomocou týchto programov nebudeme môcť spojiť skeny strán do jedného súboru. Súbory strán môžete samozrejme očíslovať v poradí a zazipsovať, aby ste ich mohli kompaktne odosielať. Náš adresát si však bude môcť postupne prezerať stránky iba v grafickom editore bez toho, aby sa mohol pohybovať v dokumente. Je to nepohodlné a stráca to čas. A všeobecne neprijateľné.

V skutočnosti pomocou týchto nástrojov získame jednotlivé digitálne fotografie stránok dokumentu.

Previesť naše rozptýlené skeny na jeden dokument s možnosťou fulltextového vyhľadávania potrebujete program na rozpoznávanie textu. Najlepší na dnešok je FineReader.

FineReader je program ruská spoločnosť ABBYY. Najnovšia verzia ABBYY FineReader 12 bola vydaná vo februári 2014. Tento program extrahuje textové údaje z digitálnych obrázkov - rozpoznáva textové znaky. Testovaciu verziu ABBYY FineReader 12 Professional si môžete stiahnuť z oficiálneho zdroja: http://www.abbyy.ru/finereader a trénujte 30 dní.

Je lepšie, keď je v počítači nainštalovaná jedna z najnovších verzií profesionálov. Tu a nižšie je popísaná práca v ABBYY FineReader 10 Professional Edition.

V predchádzajúcich lekciách sme teda stránky naskenovali štandardnými nástrojmi Windows, očíslovali, uložili s príponou „jpg“ a umiestnili do samostatného priečinka, ktorý sme nazvali „Dohoda“.

Takže pomocou úžasných funkcií rozpoznávacieho programu môžeme jednoducho previesť rôzne obrázky do upraviteľných formátov.

Viac o tom nájdete v nasledujúcej lekcii: Skenovanie v ABBYY FineReader.

A tak čítame tieto lekcie a vidíme, aké výhody nám program rozpoznávania dáva. Namiesto zdĺhavého a zdĺhavého písania z knihy alebo brožúry jednoducho naskenujeme potrebné strany pomocou FineReader, v prípade potreby ich upravíme a uložíme vo zvolenom formáte, takže môžete rýchlo zostaviť napríklad článok alebo abstrakt .

A ako skenovať stránky kníh a digitalizovať knihy, ktoré čítame v téme: Digitalizácia knihy.

Na záver si zhrňme tému: skener v kombinácii s rozpoznávacím programom je racionálnou náhradou za písanie z klávesnice. Ak máme papierovú verziu - text vytlačený na tlačiarni alebo v tlačiarni, namiesto zadávania z klávesnice ho jednoducho naskenujeme. Ďalšou populárnou oblasťou použitia skenera je digitalizácia rôznych tlačených produktov - štítkov, pohľadníc, fotografií, časopisov, kníh.

Digitalizácia dokumentov je prevod dokumentov do digitálnej podoby. Môžete digitalizovať kresby, texty a knihy. Činnosť každého priemerného úradu alebo inštitúcie skôr či neskôr vedie k formovaniu v jeho stenách obrovské množstvo Dokumenty. Dokumenty sú uložené na policiach a v zásuvkách stola. V kancelárskych skriniach a na stoloch zamestnancov kancelárie zaberajú obrovské množstvo miesta. Hory dokumentácie, ktorej je veľmi ťažké porozumieť a rýchlo nájsť ten či onen dokument je takmer nemožné. Aby sa úrad nezmenil na archívne úložisko dokumentov a jeho zamestnanci mohli rýchlo pracovať s akýmikoľvek potrebnú dokumentáciu, potrebujete zdigitalizovať všetky dokumenty dostupné vo firme a previesť ich z papierovej do elektronickej podoby s využitím služieb skenovania a rozpoznávania dokumentov. Elektronické dokumenty sa oveľa jednoduchšie spracúvajú a uchovávajú. V kancelárii nezaberú veľa miesta. Nedajú sa stratiť ani poškodiť a nájsť dokument v digitalizovanom elektronickom archíve, kde je všetko systematizované a roztriedené do zväzkov, je oveľa jednoduchšie ako v obrovskej kope papierov uložených v kancelárskej skrini. Digitalizované dokumenty je vhodné použiť aj v prípade, keď zamestnanec spoločnosti odchádza na pracovnú cestu alebo na rokovania. Malý flash disk vo vrecku dokáže obsiahnuť celý archív firemných dokumentov a dá mu možnosť v prípade potreby rýchlo nájsť akýkoľvek potrebný dokument. Využitie digitalizovaných dokumentov je veľmi pohodlné a praktické, pričom služby digitalizácie dokumentov nie sú dostatočne nákladné a sú dostupné nielen veľkým korporáciám, ale aj malým firmám a rozpočtovým organizáciám.

Digitalizácia výkresov

Digitalizácia výkresov, alebo ako sa tiež nazýva vektorizácia, umožňuje prenášať technické a architektonické výkresy z papierovej do elektronickej podoby. Služby digitalizácie výkresov môžu výrazne zjednodušiť a systematizovať systém archivácie projektovej dokumentácie a sú veľmi dôležité pre obe strany. priemyselné podniky a vedecké ústavy, ako aj pre architektonické a dizajnérske kancelárie, súkromných architektov, študentov a všetkých, ktorí podľa špecifík svojej práce alebo štúdia pracujú s kresbou. Hlavným problémom archivácie projektovej dokumentácie je spravidla hľadanie požadovaného výkresu, podmienky, za ktorých by mal byť výkres vytlačený na papieri Whatman skladovaný a jeho objemnosť. Digitalizácia výkresov môže tieto problémy efektívne vyriešiť. Keď sa kresba vďaka digitalizácii prenesie z papierový nosič v elektronickom formáte, na jeho uloženie nie je potrebné mať veľké archívne plochy, ale stačí len malé množstvo voľného miesta na pevnom disku počítača alebo iného elektronického média. Zároveň stačí jednorázovo systematizovať obsah archívu, rozložiť digitalizované výkresy do tematických priečinkov a následne je ľahké nájsť potrebný výkres. Výkresy uložené v elektronickom archíve nepodliehajú mechanickému namáhaniu, ani vplyvom iných prírodných síl a prvkov. Nedajú sa namočiť, roztrhnúť ani stratiť a vďaka záložnému systému sa stopercentne ochránite pred ich stratou či stratou. Práca s digitalizovanými kresbami je oveľa jednoduchšia ako s ich papierovými náprotivkami. Je oveľa pohodlnejšie nosiť so sebou laserový disk, na ktorom máte vždy prístup k celému archívu, než objemy veľkých papierov a nepohodlných kresieb. Áno, a ukážte výkres zákazníkovi, kde je to pohodlnejšie na monitore počítača alebo notebooku, ale bez rozloženia viacmetrového výkresového papiera na jeho stole. Nehovoriac o tom, že digitalizovaný výkres je možné jednoducho poslať cez e-mail, pričom šetríte svoj čas aj čas toho, komu bola táto kresba určená. Služby v oblasti digitalizácie výkresov dnes poskytuje mnoho spoločností a s potešením môžeme konštatovať, že naša spoločnosť patrí medzi lídrov v oblasti digitalizácie dokumentov. K dnešnému dňu máme všetko potrebné vybavenie a programy na zabezpečenie digitalizácie akéhokoľvek výkresu s úplným detailným zachovaním jeho kvality.

Digitalizácia textov

Digitalizácia textov je spôsob prevodu tlačeného textu z papierovej do elektronickej podoby. Digitalizácia textov je nevyhnutná ako pohodlný nástroj na vytváranie elektronických archívov a ako nástroj na prevod kníh a učebníc do elektronickej podoby. Teraz milovníci literárneho slova nemusia sedieť hodiny v knižniciach alebo nosiť ťažkú ​​a nepohodlnú knihu. Stačí mať elektronický tablet, ktorý sa ľahko zmestí do vrecka alebo kabelky, a prečítať si akúkoľvek beletriu alebo referenčnú literatúru.

Digitalizácia kníh

Digitalizácia textu umožňuje preniesť knihu akejkoľvek veľkosti do digitálneho formátu. Je to veľmi pohodlné a praktické. Okrem jednoduchosti použitia stojí za zmienku zrejmé ekonomické výhody. Zďaleka nie vždy si môžete kúpiť tú či onú učebnicu alebo knihu pre seba a zároveň si ju môžete požičať v knižnici alebo od kamaráta a vďaka službe digitalizácie sa stať majiteľom elektronickej verzie a míňať oveľa menej peňazí peniaze za to ako pri kúpe knihy. Digitalizácia kníh tiež výrazne zjednodušila proces uchovávania vzácnych rukopisov a kníh historickej hodnoty. Koniec koncov, papier nie je večný, ale elektronická verzia tlačeného slova môže byť skutočne uložená na tisíce rokov a nikdy nestratí svoj pôvodný obsah, čím sa zachová nielen text, ale aj ilustrácie pre potomkov.

SCAN: Technológie

Čo je to digitalizácia?

02.10.2015, Pia, 14:05, Msk 2707

Skenovanie, retrokonverzia a súvisiace služby. Prehľad technológií na konverziu dokumentov do elektronickej podoby.

Existuje niekoľko možností, ako organizovať procesy digitalizácie. Môžu sa vykonávať samostatne alebo s outsourcingom služieb, s vývozom dokumentov alebo výkonom práce na ich území. Pri digitalizácii možno použiť kancelárske, profesionálne dokumentové alebo planetárne skenery. Dáta je možné extrahovať v manuálnom, poloautomatickom alebo automatickom režime, s predbežným archívnym spracovaním papierových dokumentov alebo klasifikáciou informácií už v elektronickej podobe atď.

Ktorý spôsob si vybrať?

Riešenie závisí od konkrétnu úlohu, pretože každé z vyššie uvedených „alebo“ určuje kvalitu výsledku a cenu diela. Napríklad otázka zviazaných dokumentov je večná: je výhodnejšie skenovať pomaly vo zviazanom stave alebo minúť peniaze na zošívanie, ale rýchlo to digitalizovať na skeneroch dokumentov?

Najjednoduchší spôsob, ako si vybrať cestu, ktorá vám najlepšie vyhovuje, je vyhľadať odbornú spôsobilosť organizácie na digitalizáciu. Záujem o prácu veľké spoločnosti Bezplatne vykonajú prieskum a určia pre vás najlepší prístup. Nepremeškajte túto príležitosť a nečakajte, že budete v pokušení objednať si služby: väčšina z týchto spoločností má záujem aj o dodávku hardvéru a softvéru pre svojpomocnú digitalizáciu.

Koľko dokumentov potrebujete naskenovať?

Definujúcim parametrom je objem dokumentov.

Definujúcim parametrom je objem dokumentov. Na každodenné skenovanie malých zväzkov vyšívaných dokumentov (napríklad primárne účtovníctvo) je vhodný bežný kancelársky skener, ktorý vydrží záťaž niekoľko tisíc strán denne. Stačí ho doplniť pohodlným programom na indexovanie.

Pravidelné skenovanie veľkých objemov vyžaduje profesionálne vybavenie. Ide o priemyselné skenery, ktoré stoja veľa peňazí (takéto vybavenie používa Federálna daňová služba, Federálna colná služba a veľké banky). Preto môže byť menej nákladnou alternatívou rámcová dohoda o poskytovaní služieb periodickej digitalizácie.

Vlastná konverzia veľkých retrospektívnych polí do elektronickej formy nie je ekonomicky opodstatnená: okrem nákupu vybavenia a školenia zamestnancov budú potrebné značné náklady na prácu a čas. Rozhodne je efektívnejšie objednať si službu, keďže veľká firma dokáže vyčleniť veľký počet zamestnancov a problém rýchlo vyriešiť.

Kde skenovať dokumenty?

Definujúcim parametrom je dopyt po naskenovaných dokumentoch. Ovplyvňuje zaistenie dokumentov činnosť organizácie v čase skenovania? Toto je obzvlášť dôležité pri digitalizácii dokumentov, ku ktorým majú zamestnanci pravidelný prístup alebo ktoré môžu byť náhle vyžiadané regulačným úradom, ako aj pri odstraňovaní mimoriadnych udalostí spojených s dokumentmi. Príklady: finančné a personálne doklady, technická a prevádzková dokumentácia, knihy matriky a iné fondy odvetvia.

Oblasť skenovania, organizovaná v priestoroch firmy-odberateľa služieb.

Ak ich potrebujete dostatočne rýchlo zdigitalizovať, tradičným prístupom je objednávanie služieb s odchodom skenovacieho tímu na vaše územie. Často to vyjde lacnejšie ako dodanie podkladov do výroby dodávateľa a späť, ale všetko je dané územnou odľahlosťou. Predpisy pre prácu v teréne znamenajú skenovanie vydaného prípadu do jedného alebo dvoch pracovných dní bez dlhého vyraďovania z pracovného toku.

Mám vyšívať dokumenty?

Určujúce parametre: stav dokladov a možnosť zošitia. Ak existuje takáto príležitosť a papier je vhodný na ťahanie pomocou skenera dokumentov, mal by byť vyšívaný. Faktom je, že skenovanie zviazaných dokumentov na planetárnom (knižnom) skeneri je niekoľko desiatok krát pomalšie ako streamovacia digitalizácia. Úmerne predĺžte čas práce a cenu práce. Skenovanie na dokumentových skeneroch je aj s prihliadnutím na spojovanie rýchlejšie a lacnejšie.

Môžete vyšívať sami alebo to môžete zveriť umelcovi.

Môžete vyšívať sami alebo to môžete zveriť dodávateľovi: ak sa vyberie renomovaná spoločnosť, nemali by ste sa báť straty dokumentov. Naopak, prísna regulácia všetkých procesov a kvalitné materiály umožňujú spoločnostiam poistiť sa proti dodatočným finančným stratám a poškodeniu imidžu. Tento prístup je dokonca dôveryhodný ruské súdy: pri organizovaní skenovania, zvyčajne na základe interného príkazu, je povolené spájanie a následné zošívanie súdnych prípadov.

Mimochodom, veľké spoločnosti môžu súčasne vykonávať profesionálne archívne spracovanie: po prvé, časť práce je už vykonaná pri príprave na skenovanie, a po druhé, archívne spracovanie pomáha identifikovať nevyžiadané dokumenty a znižovať objem naskenovaných polí, čo môže znížiť náklady na prácu.

Akú kvalitu si vybrať?

Dnes je možné kvalitne naskenovať akýkoľvek objekt: od malej kartičky do knižnice až po kartičky 8A0 a divadelné kulisy.

Určenie parametrov: typ dokumentu a množstvo prijatého zdroja elektronickej forme. Skenovacie zariadenia dnes dokážu vytvárať obrázky s rozlíšením od 200 do 1200 bodov na palec (dpi). Pre umelecké diela sa zvyčajne používa rozlíšenie 400-600 dpi, čo umožňuje vytvárať vysokokvalitné reprodukcie. Viac vysoká kvalita používa sa len vtedy, keď je potrebné zväčšiť obrázok a detailne opísať malé predmety, ako sú mince.

Detailné a málo kontrastné kresby, často vyhotovené na pauzovacom papieri a modrej farbe, je potrebné naskenovať v rozlíšení 300-400 dpi a dodatočne spracovať obrázky v grafických editoroch. Zvyšok dokumentov sa zvyčajne skenuje s rozlíšením 300 dpi, čo stačí na tlač kópií bez straty kvality. Potrebné orezávanie obrázkov, geometrické korekcie, farebné korekcie, prevody do formátov pdf, tiff, jpeg atď. je možné vykonávať v plne automatickom režime pomocou programov zabudovaných v skenovacom zariadení alebo s ním dodávaných.

Vo väčšine prípadov sa používa režim farebného snímania. Je to potrebné pre všetky dokumenty, ktoré boli opravené alebo opečiatkované cez text, aby sa overilo, že z pôvodného dokumentu bola odobratá elektronická kópia s pečaťou a podpisom, ako aj pre čitateľnosť vyblednutých textov a pre vyjadrenie jedinečných vlastností dokumentu. pôvodné. O potrebe farebného skenovania umeleckých diel sa nehovorí. Režim "odtiene šedej" sa používa iba v niektorých prípadoch: keď dokumenty neobsahujú farebné atribúty alebo keď je potrebné znížiť objem prijatého elektronického zdroja.

Skenovanie je možné vykonávať nezávisle. Hlavnou úlohou je vyškoliť zamestnancov, aby správne pracovali so zložitým zariadením, pretože kvalita výsledných obrázkov je dôležitá pre následné indexovanie: zle naskenovaný dokument, tiene, odlesky a iné chyby na elektronickom obrázku môžu spôsobiť, že dôležité informácie budú nečitateľné. To zabráni použitiu technológií automatického získavania údajov a môže viesť k chybám indexovania. Nahrávanie chybných údajov do niektorých systémov ( štátne registre, účtovné systémy) nie je povolené.

Indexovanie

Jednoduché skenovanie sa používa zriedka, pretože pri ďalšej práci bude len o niečo jednoduchšie hľadať informácie v súbore grafických súborov otáčaním papiera. Aby bolo možné vyhľadávať, je potrebné v dokumente vybrať viacero atribútov (polia indexu).

Zamestnanci zapojení do hromadného indexovania dokumentov ručným zadávaním.

K názvu súboru je možné pridať vybrané atribúty. Táto prax sa vyvinula na ruských súdoch: aby operátor skenovania nemal prístup k interným systémom súdu, pri digitalizácii sa všetky potrebné údaje zadávajú do názvu súboru. Následne tieto údaje súdny systém rozpozná pri načítavaní každého dokumentu samostatne.

Zvyčajne sa však digitalizované dokumenty nahrávajú do informačný systém skupiny, čo si vyžaduje vytvorenie databázy. Ak teda potrebujete priložiť doklad k už existujúcej karte v účtovnom systéme, stačí vytiahnuť pár detailov, ktoré ho jednoznačne definujú – zvyčajne číslo a dátum.

Ak je potrebné vytvoriť vyhľadávaciu základňu na základe samotných dokumentov, potom množstvo údajov, ktoré sa majú extrahovať, je určené úlohou: od niekoľkých detailov na vyhľadávanie súboru v elektronickom archíve až po prenos všetkých dôležitých informácií do analytického databázy (celé meno, adresy, DIČ, KPP, dátumy, čísla dokumentov žiadosti atď.).

Múzeá, knižnice a archívy uplatňujú pri digitalizácii pamäťových jednotiek a účtovných dokladov vlastné pravidlá indexovania. Samostatnou oblasťou služieb je aj vektorizácia, ktorá sa využíva najmä pri digitalizácii dobre logovacích pások (automatické) a výkresov (ručné vykresľovanie v CAD systémoch).

Koľko údajov extrahovať Odpoveď na túto otázku je tiež najlepšie získať pomocou odborných znalostí, pretože počet podrobností, ktoré sa majú extrahovať, závisí od funkčnej úlohy a do značnej miery určuje náklady na digitalizáciu. V niektorých prípadoch sa môžete obmedziť na zbierky dokumentov, keď sa elektronické obrázky kombinujú pod záštitou hlavného dokumentu (napríklad zmluva alebo register účtov). V iných je pre vyplnenie karty informačného systému potrebné vyťažiť všetky údaje obsiahnuté v dokumente.

Príklady získavania údajov

Analýza objednávok zadaných na portáli zakupki.gov.ru spoločnosťami s štátna účasť a štátnych inštitúcií (44-FZ, 223-FZ), vyplýva, že:

- Na prepojenie elektronických kópií ORD s elektronickým systémom správy dokumentov postačuje číslo, dátum a typ dokumentu.

– Skenovanie finančnej dokumentácie je často sprevádzané extrakciou čísla, dátumu, mien a údajov o platiteľoch, súm.

– Digitalizácia archívnych dokumentov obcí (vyhlášky správ, mestských výkonných výborov, obecných zastupiteľstiev a pod.) za účelom poskytovania služieb a inventarizácie predmetov pozemkových a vlastníckych vzťahov si vyžaduje vyťaženie čísla a dátumu dokumentu, všetkých plných mien a adries. . Okrem toho je potrebné porovnať adresy s aktuálnymi adresármi KLADR/FIAS.

– Digitalizáciu dokumentov Archívneho fondu Ruskej federácie sprevádza prísne napĺňanie NBÚ a popis fondov v súlade s archívnou legislatívou.

– Indexovanie zásob a registrov znamená rozpoznanie všetkých ordinálnych záznamov.

– Pre prácu s kresbami v elektronickej podobe je potrebné vyťažiť takmer všetky pečiatkové polia.

– Skenovanie kompozitných prípadov vyžaduje nielen extrahovanie podrobností každého dokumentu, ale aj vytváranie vzťahov. Najťažším prípadom je projektová dokumentácia, kde vygenerovaná databáza má viacúrovňovú hierarchiu a prepojenia dokumentov.