Pagsasalin sa digital na format ng mga dokumento ng archival. Pag-scan ng archive: kung paano na-digitize ang mga dokumento ng archival

Digitization mga archive ng papel kasama ang pag-scan at pag-catalog ng mga dokumento. Kung mas malaki ang organisasyon, ang kumpanya, mas kumplikado ang daloy ng dokumento nito, mas maraming dokumento ang nakaimbak sa mga archive nito at mas kaakit-akit ang hitsura ng mga serbisyo para sa pag-digitize ng mga archive.

Maghanap ng mga matitipid

  1. Kadalasan para sa paghahanap sa pamamagitan ng archive kinakailangang dokumento nangangailangan ito ng maraming oras at pagsisikap. O maaaring lumitaw ang isang sitwasyon kapag ang parehong dokumento ay kinakailangan ng ilang empleyado nang sabay-sabay - sa kasong ito, kailangan mong gumawa ng kopya nito.
  2. Bilang karagdagan, ito ay nagkakahalaga ng pagpuna na ang madalas na pagtukoy sa mga dokumento ng papel maaga o huli ay humahantong sa kanilang pinsala, at kung minsan ay "pagkawala" kung ang mga file ay nagkakamali na inayos sa archive.
  3. Ngunit medyo simple upang malutas ang lahat ng mga problemang ito - kailangan mo lamang tiyakin ang pag-digitize ng mga archive ng papel, gumamit ng mga awtomatikong sistema ng impormasyon sa iyong trabaho, na magbibigay ng agarang paghahanap, pati na rin ang pag-access sa mga elektronikong kopya ng mga dokumento.
  4. Ang mga benepisyo ng pag-digitize ng mga archive ng papel ay marami. At pinag-uusapan natin hindi lamang ang tungkol sa qualitatively na mga bagong pagkakataon para sa probisyon at paggamit ng dokumentasyon ng kumpanya, kundi pati na rin ang tungkol sa pagtiyak sa kaligtasan ng impormasyong ito.

Mga benepisyo mula sa mga na-digitize na dokumento:

  • pagbabawas ng load sa papel archive at photocopying area;
  • ang posibilidad ng pagpapalaya ng espasyo ng archival;
  • pagbabawas ng gastos sa pagpapanatili ng mga archive ng papel.

Pag-digitize ng mga archive ng papel: mga yugto

Unang yugto. Ang lahat ng pag-digitize ng mga archive ay nagsisimula sa pagsusuri ng mga dokumento. Bilang resulta ng pagsusuri ng mga dokumento, ang istraktura ng hanay ng papel ay tinutukoy, pati na rin ang dami at mga katangian ng kalidad mga dokumento. Batay sa mga resulta ng pagsusuri, ang pagpili ng teknolohiya at pag-digitize ng mga dokumento, pamantayan para sa pagtatasa ng kalidad, ang pagpili ng komposisyon ng kagamitan ay isinasagawa, ang mga deadline at badyet ay napagkasunduan.

Pangalawang yugto ay isang pag-scan mismo. Ang pag-digitize ng mga archive ay ang proseso ng paglikha ng mga graphic na larawan ng isang dokumento gamit ang mga scanner. Bago i-convert ang isang dokumento sa elektronikong anyo, pipiliin ng operator ang pinakamainam na mode ng pag-scan, magsagawa, sa katunayan, mag-scan, habang kinokontrol ang kalidad ng mga resultang imahe sa monitor.

Ang epekto ng pagpapakilala ng isang electronic archive

Ang pag-digitize ng mga archive ng papel ay nagreresulta sa mga elektronikong kopya ng mga dokumento. Ang propesyonal na kagamitan na ginagamit ng aming kumpanya ay nagbibigay-daan sa pag-scan iba't ibang mga dokumento sa bilis na hanggang ilang libong pahina bawat araw - sa batch mode. Ang mga resultang file ay isinulat sa mga flash drive, CD, DVD at iba pang media.

I-archive ang mga resulta ng digitization

Kaagad pagkatapos makumpleto ang pag-digitize ng mga archive, ang mga graphic na imahe ay sumasailalim sa awtomatikong pagpoproseso - paghahati-hati sa pamamagitan ng mga pahina ng pagkalat, pag-crop sa mga gilid, pag-align sa pamamagitan ng mga linya, pag-aalis ng ingay, pagpapabuti ng kalidad ng mga imahe, at iba pa. Maaari mong itakda ang mga parameter para sa pag-catalog ng mga na-scan na dokumento sa iyong paghuhusga, sa gayon ay matiyak ang pag-optimize ng mga proseso ng negosyo mula sa panig ng pamamahala ng dokumento.

Sa kasalukuyan, higit na binibigyang pansin ang mga isyu ng pangangalaga ari-arian ng kultura... Kaugnay nito, ang mga programa ng pamahalaan, kung saan, ayon sa konsepto ng kanilang mga tagalikha, ang paggamit ng mga bagong teknolohiya, mga makabagong diskarte, pati na rin ang karanasan sa mundo ay titiyakin ang kaligtasan pamanang kultural, mahahalagang dokumento sa kasaysayan. Samakatuwid, ngayon ang mga archive ng Russia ay nagsasalin ng mga dokumento ng papel sa electronic form. Tungkol sa kung ano ang nagsilbing simula ng malakihang gawaing ito, kung ano ang mga paghihirap na kinakaharap ng mga archivist at kung paano nila nalutas ang mga isyu sa pangangalaga ng mga digitized na dokumento, Deputy Head ng Federal Archival Agency (Rosarkhiv) Oleg Naumov sinabi sa reporter ng PC Week / RE Olga Zvonareva.

Linggo ng PC: Mangyaring sabihin sa amin kung paano nagsimula ang proseso ng pag-digitize ng mga dokumento ng archival, ano ang mga tampok ng gawaing ito?

Oleg Naumov: Ang gawain ng malawakang pagsasalin ng mga dokumento ng archival sa elektronikong anyo ay itinakda sa programa ng Information Society (2011–2020). Ito ay hindi isang madaling gawain sa lahat. Bilang karagdagan, ang pag-digitize ng mga dokumento ay isang bagay, at ang pag-digitize ay isa pa. kagamitang pang-agham at sanggunian(NSA), kung wala ito ay hindi mo mahahanap ang kinakailangang dokumento... Samakatuwid, noong dalawang taon na ang nakalipas ay nagkaroon ng pagkakataon para sa normal na pagpopondo ng trabaho sa loob ng balangkas ng pederal target na programa"Kultura ng Russia 2012-2018", una sa lahat, nagsimula silang lumikha sa elektronikong pormat NSA, na nagbibigay-daan sa iyong mahusay na maghanap ng mga dokumento.

Linggo ng PC: Ano software ginamit sa kasong ito?

SIYA.: Matagal bago ang pag-ampon ng programa ng Information Society, nagsimulang bumuo si Rosarkhiv ng isang all-Russian standardized software para sa pag-aayos ng accounting ng dokumento - ang Archive Fund software complex. Sistema ng pagmamay-ari Pederasyon ng Russia, ipinakilala sa antas ng pederal, rehiyonal at munisipal na mga archive. Sa paggamit nito, ang isang sentral na katalogo ng stock ay nilikha at nai-post sa portal ng Archives of Russia. Sa una, ang "Archive Fund" ay nilikha bilang isang accounting apparatus, ngunit pagkatapos ay nagsimula itong gamitin bilang isang paghahanap. Ang ilang mga archive ay gumagamit na ngayon ng mga dalubhasang search engine.

Linggo ng PC: Aling karanasan sa archive ang mahalaga sa pag-digitize ng mga imbentaryo?

SIYA.: Ang unang taong nag-digitize ng lahat ng mga imbentaryo sa ating bansa, dahil lamang sa mga pangyayari, ay ang Russian State Historical Archive sa St. Petersburg. Nang lumitaw ang tanong tungkol sa kanyang paglipat, ang mga imbentaryo ay na-scan, at ang kanilang mga elektronikong imahe ay ginamit sa lahat ng mga yugto ng paggalaw, iyon ay, bawat kahon, bawat kaso ay sinusubaybayan.

Ito ay isang magandang karanasan, ngunit mula sa punto ng view ng pag-unlad ng teknolohiya ng impormasyon, ito ay hindi masyadong matagumpay. Bagaman naging posible na makilala sila sa silid ng pagbabasa at online, hindi pinapayagan ng koleksyon ng mga graphic na larawan ang mga awtomatikong paghahanap. Ang mga imbentaryo na isinalin sa format ng database, na may posibilidad ng simple at advanced na paghahanap, ay mas maginhawa para sa mga user. Sinimulan ni Rosarkhiv na aktibong tustusan ang gawaing ito. Sa ngayon, humigit-kumulang 20-30% ng mga imbentaryo ng mga pederal na archive ang nagawa.

Linggo ng PC: Anong mga paghihirap ang kinakaharap ng mga archive kapag nagdi-digitize ng mga dokumento?

SIYA. Ang unang problema ay ang malaking volume. Pangkalahatang volume Pondo sa archive Ang RF ay nagkakahalaga ng 494 milyong mga file, kung saan 9% ay nasa mga pederal na archive.

Ngunit ang pinakamahirap na bagay ay upang matukoy kung aling mga dokumento ang dapat i-digitize. Ang pinakasimpleng sagot ay ang pinaka hinihiling. Paano matukoy ang demand na ito? Ngayon ang isa ay hinihiling, bukas ay isa pa. At sa panahon ng Sobyet ipinakilala ang konsepto ng mga partikular na mahalagang pondo at dokumento ng archival. Ginamit ang mga ito upang lumikha ng isang pondo ng seguro sa microfilm, pati na rin ang isang pondo para sa paggamit. Gayunpaman, ngayon ang mga dokumentong ito ay halos hindi hinihiling. Iyon ay, ang pamantayan para sa halaga at kaugnayan ng mga dokumento mula sa panahon ng Sobyet ay hindi gumagana ngayon. Ang demand ay patuloy na nagbabago. Halos imposibleng tiyakin kung aling mga dokumento ang higit na hihilingin.

Mahalaga rin ang teknikal na bahagi ng isyu. Halimbawa, isang malaking pangangailangan ang lumitaw para sa pagsasama-sama ng kanilang sariling mga pedigree. Ito ay isang mabuti at kinakailangang negosyo. Nagsimula silang aktibong mag-order ng mga kasong ito: mga rehistro ng mga kapanganakan, mga kuwento ng rebisyon. Ngunit ang mga ito ay ganap na hindi inangkop para sa gayong paggamit ng masa. Ang pag-scan sa kanila bilang ang pinaka-hinihiling ay walang kapararakan. Mula sa isang aklat na 80 cm ang kapal, isang pahina lamang ang kailangan ng isang tao. At para matugunan ang pangangailangang ito, kailangan mong mag-scan ng isang buong libong pahina. At kahit may turnover. Ngunit, sa kabilang banda, kung i-scan mo ang mga dokumentong ito, ang mga orihinal ay aalisin sa sirkulasyon at ang kanilang pisikal na kaligtasan ay ginagarantiyahan. Lahat sila ay natatangi. At higit sa lahat, hindi dadalhin ng mga kapus-palad na tagapag-alaga (na kung saan maraming babae) ang lahat ng toneladang papel na ito sa kanilang mga kamay.

Gayunpaman, dito kami tumakbo sa anyo ng pagbibigay ng impormasyon. Pagkatapos ng lahat, ito ay mas kawili-wili para sa gumagamit na makakuha ng hindi isang imahe, ngunit isang decryption at isang database. At ang hanay ng mga dokumentong ito ay napakalaki. Sa RGADA lamang, sa pondong 350 "Landrath Books and Revision Books" - higit sa limang libong kaso, humigit-kumulang 3 milyong pahina. Ilang tao ang kailangang masangkot? Nakakita sila ng magandang paraan sa Perm: nakakuha sila ng mga pondo na inilaan para magbigay ng mga trabaho. Ang gawain ay ginawa ng mga tao sa bahay. Matagumpay nating nalutas ang problema ng kawalan ng trabaho. At sa huli ay nagawa nila ang hindi kayang gawin ng sinuman sa Russia, sa aking memorya.

Ang karanasan sa pag-scan sa mga pederal na archive ay nagbibigay-daan sa amin upang makagawa ng dalawang konklusyon. Una, ang paglikha ng elektronikong pondo para magamit nang hindi gumagawa ng NSA ay isang hindi produktibong aktibidad. Lumalabas ang isang malaking tumpok ng mga pag-scan, kung saan imposibleng mahanap ang tama. Pangalawa, ipinapayong isailalim ang mga natapos na complex - mga pondo o imbentaryo - sa pag-scan, lalo na ang mass scanning. Sa kasong ito, ang mga kaso ay dapat na ma-scan nang buo upang maiwasan ang mga salungatan kung sakaling magkaroon ng mga pagkakamali sa pagnunumero. V indibidwal na mga kaso, dahil sa pagiging natatangi at kahalagahan ng mga dokumento, hindi alintana kung mayroong anumang teksto sa reverse side ng sheet o wala, kinakailangang i-digitize ang sheet, kabilang ang likod. Tapos yung tanong kung may tinatago ba tayo.

May problema sa pagpili ng kagamitan. Sa isang lugar kailangan mo ng isang simpleng scanner, sa isang lugar dapat itong maging mas kumplikado. Halimbawa, ang isang "malalim na duyan" ay espesyal na iniutos para sa pag-digitize ng mga aklat ni Landrat. Kung hindi man, huwag kopyahin, dahil ang kapal ng gulugod ng ilang mga libro ay umabot sa 80 cm.

Linggo ng PC: Ano ang pangunahing layunin ng digitization ngayon?

SIYA. Tatlo sila. Ang una ay ang pagpapalawak at pagpapadali ng pag-access sa mga dokumento ng Archive Fund. Ang pangalawa ay upang matiyak ang kaligtasan ng mga orihinal sa pamamagitan ng pag-alis sa mga ito mula sa sirkulasyon at pagbibigay ng access sa elektronikong pondo ng paggamit. Ang pangatlo ay ang pasimplehin ang pagbibigay ng serbisyo publiko. Ngayon maraming mga indibidwal na kahilingan ng mga mamamayan para sa mga dokumento sa mga tauhan. Ang mga archive ay nagsisimula na ring i-digitize ang mga ito at gumamit ng mga elektronikong kopya upang maghanda ng mga tugon, na makabuluhang nagpapabilis sa gawain.

Linggo ng PC: Paano idinidigitize ng mga archive ang mga dokumento?

SIYA. Ang proseso ay napupunta sa iba't ibang paraan: kung saan sila mismo ang gumagawa nito, gamit ang mga improvised na paraan o pagkuha ng iba't ibang kagamitan. Ang pangalawang paraan ay ang pagsali sa labas ng mga organisasyon. Gayunpaman, wala pa ring tiyak na sagot sa pinakamahalagang tanong: ano ang ating sinisikap kapag nagdi-digitize tayo ng mga dokumento?

PC Week: At walang nagtatanong sa kanila?

SIYA. Bakit, lahat nagtatanong. Ngunit paano mo mahahanap ang tanging tamang sagot? Siyempre, ang bentahe ng paggamit ng mga digitized na dokumento ay kitang-kita. Ito, seguridad, at malayuang pag-access, at ang kadalian ng pagbibigay ng impormasyon, at ang kadalian ng paggawa ng mga kopya - isang buong hanay ng mga pakinabang. Ang isa pang bagay ay kung paano makamit ito? Narito ikaw ay isang user, nagpunta ka sa site at natukoy na ang mga dokumentong kailangan mo ay naka-imbak. Sabihin natin sa Perm. Pumunta kami sa site gamit ang link, nakakita ng imbentaryo ng mga kaso. Mayroong isang kawili-wiling kaso. At paano mo ito makukuha? Buti naman kung digitalized na. At kung hindi? Pumunta mismo sa archive at mag-order ng mga orihinal? O dapat bang i-digitize ng archive ang lahat ng kaso? Ngunit ito ay hindi totoo. Kaya, sa katunayan, mayroon lamang isang pagpipilian na natitira. Paglikha sa bawat archive ng posibilidad ng agarang paggawa ng mga elektronikong kopya sa kahilingan ng gumagamit. Bukod dito, maaaring hindi ito ang sarili nitong subdivision. Maaari rin itong maging outsourcing. Ngunit ang ganitong serbisyo ay dapat na maibigay kaagad. Ngunit ipinapakita ng karanasan na makatuwirang gawin ang mga kopyang ito kapag mayroon na elektronikong sistema, na magbibigay-daan sa iyong ilagay ang mga materyal na ito sa isang mataas na kalidad at nakaayos na paraan. Pagkatapos ito ay gagana. Kailan natin gagawin, at kung kakayanin ba natin, sa totoo lang, hindi ko alam.

Linggo ng PC: Marahil, bago pa man maaprubahan ang programa ng Information Society noong 2010, naisagawa na ang gawaing digitization?

SIYA. Oo. Nagkaroon ng magkakahiwalay na proyekto. Halimbawa, ang Electronic Archive ng Comintern o ang koleksyon ng mga dokumento ng SVAG. Bilang isang patakaran, sila ay ipinatupad nang magkasama sa mga dayuhang kasosyo. Walang sapat na sariling pondo para sa kanilang pagpapatupad. Hindi ito naging madali. Nagkaroon ng teknikal, metodolohikal, organisasyonal at teknolohikal na mga paghihirap. Ngunit ang karanasan ay nag-iipon. At ngayon ito ay lubhang kapaki-pakinabang.

Linggo ng PC: Ibig sabihin, pagkatapos ng pag-apruba ng programa, sinimulan nilang matukoy kung ano ang dapat na pangunahing pamantayan para sa pag-digitize ng mga dokumento?

SIYA. Ang programang ito, sabihin nating, ay nagpapahintulot sa mga archivist na maakit ang atensyon ng mga awtoridad sa katotohanang mayroong problema at ito ay kinakailangan upang malutas ito. Maghanda at aprubahan ang mga programa sa digitalization. At upang maakit ang pananalapi para dito. Ngunit ngayon ay walang isang unibersal na pamantayan. Mahirap tumukoy ng one-size-fits-all na diskarte dahil ang mga archive ay nag-iimbak ng ganap na magkakaibang dokumentasyon.

Linggo ng PC: Kaya ang bawat archive ay talagang tinukoy ang pamantayan mismo?

SIYA. Sa katunayan, oo. Sa prinsipyo, apat na pamantayan ito, karaniwang tinatanggap, ngunit hindi ko sasabihin na sila ang pinaka tama. Ito ang pangangailangan para sa mga dokumento, tinitiyak ang kaligtasan, pinapadali ang gawain ng mga empleyado ng archive, pagpapabuti ng mga kondisyon para sa paglilingkod sa mga gumagamit. Dagdag pa, ang pagbilis ng trabaho. Kung mayroon akong electronic NSA sa aking site, ang user ay pupunta sa archive na inihanda sa pamamagitan ng pagtingin sa imbentaryo sa Internet. Kung ang mga kinakailangang dokumento ay nai-digitize na, mayroon siyang pagkakataon na tingnan ang mga ito sa kanyang computer nang hindi pumupunta sa archive, o matanggap ang mga ito sa silid ng pagbabasa nang walang pagkaantala.

Linggo ng PC: Lumalabas na ang bawat archive ay kailangang magpasya para sa sarili nito kung ano ang idi-digitize sa unang lugar?

SIYA. Medyo tama. Ito ay dapat na isang eksklusibong indibidwal na programa para sa bawat archive. Hindi ka makakagawa ng isa. Depende ito sa maraming mga kadahilanan: sa mga kakayahan sa pananalapi, sa antas ng pag-unlad at pagpapatupad ng mga teknolohiyang IT, sa partikular na pangangailangan. Kaya, ang isang tao ay may malaking pangangailangan para sa mga dokumento sa mga tauhan, at ito ay kinakailangan upang matugunan ang mga pangangailangan ng mga mamamayan. Bagaman mula sa isang punto ng view ng archival, ang mga dokumentong ito ay hindi permanente, ngunit isang pansamantalang panahon ng pag-iimbak ng 75 taon. Ngunit ginagawa nitong mas madali ang trabaho at tumutulong sa mga tao, dahil ang isang tao ay hindi naghihintay ng tugon sa isang kahilingan sa loob ng isang buwan, ngunit natatanggap ang kinakailangang impormasyon sa loob ng dalawang araw. Nangangahulugan ito na kinakailangan na mamuhunan ng mga puwersa at pondo dito.

Linggo ng PC: Kapag tinutukoy ang mga priyoridad ng mga dokumentong idi-digitize, iniuugnay ba ng mga archive ang mga ito sa Rosarchiv?

SIYA. Kung pag-uusapan natin ang tungkol sa mga archive ng rehiyon, kung gayon hindi. Ito ang negosyo ng bawat archive. Ipinapadala nila sa amin ang kanilang mga programa para sa impormasyon at pag-digitize. Nakikilala natin sila at nagbibigay ng ating payo. Tinutulungan namin sila sa abot ng aming makakaya, maglaan ng mga pondo para sa pederal na target na programa. Ang mga pederal na archive ay isa pang bagay. Narito ang posisyon ng Rosarkhiv ay may tiyak na kahalagahan. Ngunit kahit dito walang unibersal na pamantayan. Upang matugunan ang patuloy na pagtaas ng demand para sa genealogical na impormasyon, naglaan si Rosarkhiv ng higit sa 40 milyong rubles. para sa pagsasalin sa elektronikong anyo ng mga aklat ni Landrat na nakaimbak sa RGADA. Ang pagtugon sa tuluy-tuloy na interes ng publiko sa kasaysayan ng ating sariling bayan sa kamakailang nakaraan, noong Hunyo ng taong ito ay inilunsad ang site na "Mga Dokumento ng panahon ng Sobyet", kung saan ang mga larawan ng mga dokumento mula sa personal na pondo ng IV Stalin at ng Politburo ng Naka-post ang Komite Sentral. Ang mga proyekto sa Internet na nakatuon sa ika-1150 anibersaryo ay inihanda estado ng Russia, ika-400 anibersaryo ng pagtatapos ng Troubles, ika-200 anibersaryo Digmaang Makabayan 1812 Naturally, ang mga larawan ng pinakamahalaga at hinihiling na mga dokumento ay inilagay doon.

Linggo ng PC: Kaya ngayon ay mga elektronikong kopya lamang ang ibibigay sa silid ng pagbabasa ng archive, at hindi mga orihinal na dokumento?

SIYA. Sa isip, gusto mong mahanap ng tao ang dokumentong hinahanap niya sa website, mag-order ng kaso at tumanggap ng mga na-scan na dokumento. At ang orihinal ay nananatiling buo. Gayunpaman, may mga kaso kung kailan kinakailangan upang tingnan ang orihinal. Halimbawa, gaano man kahusay ang pamamaraan, hindi ito maglilipat ng mga watermark. At ayon sa kanila, maaari mong itatag ang petsa ng dokumento. Ngunit ang mga ganitong kaso ay isa sa isang libo.

Linggo ng PC: Lumalabas na ibinigay ng archive ang user serbisyo publiko, ngunit pagkatapos nito kailangan mong mag-save ng isang digitized na kopya ng dokumento?

SIYA. Siyempre, ito ang bentahe ng pag-scan. Dati mayroong microfilms, copier, at typescript. At ang archivist, na gumawa ng mga kopya, ay ibinigay ang mga ito sa gumagamit. Ibig sabihin, wala siyang kopya ng dokumento. Sa kaso ng digitization, nananatili ang isang kopya. Ngunit ang lokasyon ng imbakan ay dapat na malinaw na tinukoy para dito. At kung may pangalawang kahilingan mamaya, hindi na kailangang itaas ang kaso. Kailangan nating magkaroon ng karanasan sa ganitong gawain.

Linggo ng PC: Paano tinutukoy ang mga petsa para sa pag-digitize ng mga arrays ng dokumento?

SIYA. Ang tiyempo ay nakasalalay sa tatlong dahilan: sa teknikal at pinansyal na kakayahan at sa estado ng mga dokumento. May mga dokumento na nakatali sa paraang kahit na ang pinakamodernong teknolohiya ay hindi ganap na makuha ang teksto. Iyon ay, kakailanganin mong burdahan ang mga ito, na hindi masyadong gusto ng mga dokumento o archivists. Scan. Pagkatapos ay tahiin pabalik. Kailangan ng oras. Gayundin, ang tiyempo ay nakasalalay sa dami ng mga kaso, sa bilang ng mga sheet sa kanila. Hindi gaanong mahirap i-scan ang isang stack ng karaniwang papel, ngunit ang isang 3x8 m card ay mas mahirap. Ayon sa mga dokumento ng accounting, ito ay isang sheet. Ngunit ito ay na-scan lamang sa mga bahagi. At pagkatapos ay sa software na ito ay kinakailangan upang "stitch" ang lahat ng ito, ayusin at makita kung paano ang dokumentong ito ay tumingin.

Linggo ng PC: Paano nagpapatuloy ang gawain sa pagpapatupad ng ika-89 na punto ng pederal na target na programa na "Kultura ng Russia (2012–2018): ang pagbuo ng mga elektronikong mapagkukunan ng archival at ang kanilang probisyon sa Internet"?

SIYA. Bilang bahagi ng pagpapatupad ng item na ito, ang mga imbentaryo ay na-digitize. Ang pag-digitize ng mga dokumento, kabilang ang mga aklat ng Landrat, ay isinasagawa din. Bukod dito, sinusubukan naming tulungan ang mga rehiyon: isinama namin ang humigit-kumulang lima hanggang anim na rehiyon sa isang taon sa programang ito at naglalaan ng mula 10 hanggang 15 milyong rubles. Lumilikha kami ng mga online na eksibisyon, atbp. Sa kabuuan, 67 milyon ang inilalaan bawat taon para sa pagpapatupad ng trabaho sa ilalim ng programang ito.

Linggo ng PC: Nakadepende ba ang pamamahagi ng mga pondo sa antas ng kahalagahan at kahalagahan ng mga dokumento?

SIYA. Oo. Ang mga archive ay nagsumite ng mga aplikasyon sa isang partikular na form para sa pakikilahok, isinasaalang-alang namin ang mga aplikasyong ito. Gayundin, nalalapat ang mga kumpanyang nag-iisip na nag-aalok sila ng mga kawili-wiling bagay. Isinasaalang-alang namin ang mga ito, pumili ng mga kagiliw-giliw na promising na solusyon, gumuhit ng isang pangkalahatang plano at magsagawa ng mga pagbili para sa mapagkumpitensyang batayan... Noong nakaraang taon, mayroong 52 kontrata ng gobyerno para sa kaganapang ito. Ibig sabihin, every week kaming pumirma ng kontrata.

Linggo ng PC: Nahawakan mo ang paksa ng mga dokumentong nakaimbak na sa archive, simula noong ika-11 siglo, ngunit ang mga archive ay tumatanggap din ng mga bagong dokumentong papel at ito ay isang malaking hanay. Paano ginagawa ang trabaho sa kanila? Paano nareresolba ang isyu ng kanilang digitization?

SIYA. Para sa amin, isa lang ang mahalaga: kung ang mga dokumentong ito ay kabilang sa komposisyon ng archival fund o hindi. Ibig sabihin, napapailalim sila sa isang permanenteng shelf life o hindi. At pagkatapos, mula sa punto ng view ng paggamit, hindi mahalaga kung ang mga ito ay mga dokumento ng ika-11 o ika-21 siglo. Sa bagay na ito, sila ay pantay-pantay. Ito ay isa pang usapin na natural na mayroon tayong pondo sa seguro at pondo para sa paggamit para sa mga dokumento ng ika-11 siglo. At ang mga natatanging dokumentong ito ay bihirang ibigay. Mayroong isang espesyal na Rehistro ng Estado ng mga natatanging dokumento ng Russian Federation, na nai-post sa website ng Rosarkhiv at naglalaman ng kanilang mga paglalarawan at mga elektronikong imahe.

Linggo ng PC: Sa bagay na ito, malamang na mas madaling tanggapin ang mga dokumentong isinalin sa elektronikong format para sa imbakan? Halimbawa, ang mga pagbabago sa batas tungkol sa dokumentasyon ng mga tauhan ay nagsimula na, at ang mga archive, marahil, ay maaaring tanggapin ito sa elektronikong anyo?

SIYA. I guess, oo. Ngunit mayroong isang espesyal na kahulugan para sa mga archive ng estado na kunin modernong mga dokumento sa mga tuntunin ng mga tauhan, hindi. Para saan? Kalkulahin ang iyong pensiyon? meron Pondo ng Pensiyon, na mayroong espesyal na pagpaparehistro ng mga mamamayan, mula noong 2000.

Linggo ng PC: Kaya ang mga archive ay hindi tumatanggap ng mga dokumento na nakaimbak sa loob ng 75 taon?

SIYA. Hindi, matagal na namin itong itinatago. At ngayon kami ay aktibong nakikipag-usap sa parehong Pension Fund upang bawasan ang panahong ito para sa mga dokumentong papel mula 75 hanggang 15 taon. Ngunit natatakot ang Pension Fund na maaaring bumagsak ang kanilang electronic system.

At ang mga dokumentong iyon na darating sa amin sa elektronikong anyo ay isang napakalaki at ganap na hiwalay na problema. Ito ay mga katanungang may kinalaman pamamahala ng elektronikong dokumento, mga elektronikong dokumento... Kung paano dalhin ang mga ito, kung paano iimbak ang mga ito ay isang hiwalay na paksa.

PC Week: Nakatanggap ka na ba ng mga ganoong dokumento?

SIYA. Hindi, ginagawa nila. Tinanggap ng GARF ang mga materyales ng census ng populasyon at ang census ng agrikultura sa elektronikong anyo. Ang isa pang bagay ay ang mga census na ito ay umiiral lamang sa elektronikong anyo. Ngunit wala pang malawakang pagtanggap ng dokumentasyon ng opisina. Mayroong ilang mga hindi nalutas na mga isyu dito.

PC Week: Paano naman ang mga dokumento ng mga liquidated na organisasyon? Tinatanggap ba sila para sa imbakan?

SIYA. Tinatanggap namin. Totoo, sa kaganapan ng pagkalugi at pagpuksa ng kumpanya, ang mga liquidator ay obligadong maghanap ng pera upang ilarawan ang mga dokumento ng mga liquidated na organisasyon, ngunit hindi nila ito laging nahahanap.

Linggo ng PC: 15 pederal na archive ang nasa ilalim ng pamumuno ng Rosarkhiv. Mga archive ng rehiyon sa kasalukuyan inalis sa kontrol ng iyong departamento?

SIYA. Oo, walang direktang kontrol sa kanila. Sumunod sila mga ehekutibong katawan mga paksa ng pederasyon. Sa isang lugar ang mga ito ay mga independiyenteng serbisyo ng archival. Sa isang lugar sila, tulad natin, ay kasama sa mga ministeryo ng kultura. Sa isang lugar - sa Ministry of Justice o direkta sa opisina ng gobernador. Ngunit ang patayong kapangyarihan na nasa Unyong Sobyet at umiral hanggang 2004, sa kasamaang-palad, ay wala na. Sa ngayon, pinananatili namin ang aming pagkakaisa sa pamamaraan. Tinutulungan namin ang mga archive ng rehiyon sa abot ng aming makakaya. Ang mga kinatawan ng Rosarkhiv ay nakikibahagi sa taunang gaganapin sa bawat isa pederal na distrito siyentipiko at metodolohikal na mga konseho. Minsan sa isang taon, ang isang Archival Council ay ginaganap, na pinagsasama-sama ang mga archivist mula sa buong bansa. Ibig sabihin, nananatili ang mga koneksyon. Nagbibiro kami na ang archivist ay isang propesyon kung saan sa anumang lungsod ay makikita mo ang iyong sarili nang walang pera at mga bagay, pumunta sa mga kapwa archivist, at tatanggapin ka nila, pakainin at pauwiin ka. Mayroong isang kapatiran na, sa katunayan, ay hindi katangian ng anumang iba pang propesyon.

PC Week: Salamat sa chat.

Sa opisina, madalas na kinakailangan na magpadala ng mga kopya ng e-mail - mga elektronikong bersyon ng mga naka-print na dokumento. Ang mga ito ay maaaring iba't ibang kilos, invoice, sulat, kontrata, batas, tala sa opisina at anumang iba pang posibleng dokumento.

Sa bahay, mayroon kaming mga lumang litrato na naging hurado sa paglipas ng mga taon, at nais naming panatilihin ang mga ito.

Saglit kaming binigyan ng isang kawili-wiling libro, ngunit gusto kong magkaroon nito sa bahay. Paano gawin ang lahat? Ang aming panandaliang papel na mga dokumento ay kailangang i-convert sa electronic form, iyon ay, digitized at i-save.

Ang digitization ay ang pagsasalin ng isang imahe o analog na audio/video signal sa isang digital na format na angkop para sa pagre-record sa isang electronic medium.

Para sa pag-digitize ng mga larawan ng isang bagay, mayroong mga espesyal na device - mga scanner. May mga barcode scanner, film scanner. Binabasa ng mga biometric scanner ang pattern ng retina o papillary pattern ng balat ng mga daliri ng kamay. Ang hugis ng volumetric na bagay ay binabasa ng isang three-dimensional na 3D scanner.

Sa mga scanner para sa pagproseso ng papel na media - mga guhit, litrato, mga tekstong dokumento, ang imahe ay iluminado linya sa pamamagitan ng linya na may isang espesyal na lamp, at ang reflected light flux ay nakatutok sa isang light-sensitive matrix. Kino-convert ng analog-to-digital converter ang mga natanggap na electrical signal sa isang binary data system, na bumubuo ng digital copy ng imahe.

Ang pagpili ng isang scanner ay nakasalalay sa mga gawain at mga detalye ng aplikasyon nito. Ang isang scanner sa opisina ay halos palaging ginagamit upang i-digitize ang mga dokumento. Kahit na ang mga litrato ay na-scan, ang mataas na kalidad na mga kinakailangan ay hindi ipinapataw sa kanila sa opisina. Ang resolusyon ng 300 dpi ay sapat upang matiyak ang tumpak na operasyon ng mga programa sa pagkilala at upang makakuha ng mahusay nababasang teksto... Ang anumang scanner na ginawa ngayon ay nagbibigay ng isang resolusyon na katanggap-tanggap para sa trabaho sa opisina.

Nalalapat din ito sa lalim ng kulay. Halos bawat modernong scanner ay nagpaparami ng antas ng kulay abong kinakailangan para sa mga naka-print na dokumento.

Ito ay mahalaga sa opisina, kung saan ang pangunahing gawain ay upang mabilis na i-digitize ang mga dokumento ng teksto sa pamamagitan ng pahina, ito ay upang i-automate ang proseso ng pag-scan. Maaaring gamitin ang mga sheet-fed scanner. Dito, ang isang sheet ng dokumento ay ipinasok sa puwang ng makina at hinila, tulad ng sa isang fax, kasama ang mga roller ng gabay. Ang nasabing scanner ay maginhawa sa isang built-in na awtomatikong sheet feeder. Nag-load kami ng ilang mga sheet ng isang multi-page na dokumento sa tray, at habang nagdi-digitize ang scanner, sabay-sabay kaming gumagawa ng iba. Simple lang ang lahat dito. Kung ang naaangkop na OCR software ay naka-install, ito ay sapat na upang pindutin ang isang pindutan upang i-digitize at i-save ang dokumento sa nais na format sa naturang scanner.

Ang isang modernong solusyon sa opisina para sa isang departamento ng isang kumpanya ng proyekto, halimbawa, ay maaaring isang A3 format scanner na kasama sa isang multifunctional na aparato kasama ang isang A3 / A4 printer. Maginhawang mag-digitize at gumawa ng mga kopya ng mga guhit sa naturang MFP.

Malinaw na ang pag-scan ng nakatali na magazine o pagkalat ng isang libro sa isang sheet-fed scanner ay hindi gagana.

Para sa pag-scan ng mga double-sided na dokumento, mayroong mga duplex scanner, kung saan ang dalawang elemento ng pag-scan ay nagpoproseso sa magkabilang panig ng sheet sa isang pass.

Ang isang magandang solusyon para sa bahay ay isang color inkjet MFP. Ang MFP ay isang multifunctional na device na may kasamang scanner at printer. Ang ganitong aparato ay isa ring makinang pangkopya. Iyon ay, ang MFP ay maaaring awtomatikong mag-scan ng isang dokumento at mag-print ng isang kopya nito - lumikha ng isang photocopy ng dokumento.

Ang compact na device na may pinagsamang mga function ay tumatagal ng mas kaunting espasyo sa mesa. Ang halaga nito ay makabuluhang mas mababa kaysa sa kabuuang halaga ng mga device na kasama dito, kung bibilhin mo ang mga ito nang hiwalay. Sa isang color inkjet printer, gumagawa kami ng mga de-kalidad na larawang may kulay at business card, at gamit ang flatbed scanner, dini-digitize namin ang mga dokumento, photo album o mga kinakailangang aklat.

Sa susunod na mga aralin, matututunan natin kung paano manu-manong i-digitize, i-convert at i-save ang mga tekstong dokumento sa isang flatbed scanner, bawat pahina.

Sa mga halimbawang ito, gumamit ako ng sikat na A4 desktop MFP para sa pag-scan. Ang gayong murang aparato ay ang pinakamainam na solusyon para sa bahay at maaaring maging pangalawa, karagdagang MFP sa opisina.

Ipagpalagay na mayroon kaming isang multipage na lohikal naka-link na dokumento, na kailangang i-digitize at ipadala sa pamamagitan ng koreo sa aming katapat. Tawagin natin itong "Kontrata".

Sa aming minamahal na Windows XP, mayroong isang karaniwang "Wizard para sa pagtatrabaho sa isang scanner o digital camera." Para gumana ang wizard, dapat na naka-install ang scanner sa computer at dapat na naka-on. Ang wizard ay napakadaling gamitin, at mayroong isang maliit na tutorial sa aralin sa pag-digitize ng mga dokumento sa Windows XP.

Sa Windows 7, ang karaniwang tampok na Windows Fax at Scan ay ang tool para sa paglikha ng mga elektronikong kopya ng mga naka-print na dokumento at larawan.

Kaya, binasa namin ang mga aralin at gamit ang isa sa mga program na ito ay nakatanggap ng mga scan file ng mga pahina ng aming kontrata sa isa sa mga graphic na format, nai-save, at mangyaring ilakip ang mga ito sa iyong email, ipadala sila sa address.

Ang masamang bagay dito ay kapag nag-scan ng isang multi-page na dokumento gamit ang mga program na ito, hindi namin magagawang pagsamahin ang mga pag-scan ng mga pahina sa isang file. Siyempre, maaari mong bilangin ang mga file ng pahina sa pagkakasunud-sunod at i-zip ang mga ito para sa compact distribution. Ngunit ang aming addressee ay makakakita lamang ng mga pahina sa isang graphical na editor isa-isa, nang hindi nakakapag-navigate sa dokumento. Ito ay hindi komportable at nag-aaksaya ng oras. At, sa pangkalahatan, ito ay hindi katanggap-tanggap.

Sa katunayan, gamit ang mga tool na ito, nakakakuha kami ng mga indibidwal na digital na litrato ng mga pahina ng dokumento.

Upang i-convert ang aming mga nakakalat na pag-scan sa nag-iisang dokumento na may posibilidad ng full-text na paghahanap, kailangan mo ng programa sa pagkilala sa teksto. Ang pinakamahusay para sa ngayon ay ang FineReader.

Ang FineReader ay isang programa kumpanyang Ruso ABBYY. Ang huling ABBYY FineReader na bersyon 12 ay inilabas noong Pebrero 2014. Kinukuha ng program na ito ang data ng teksto mula sa mga digital na imahe - kinikilala ang mga character ng teksto. Maaaring ma-download ang isang bersyon ng pagsusuri ng ABBYY FineReader 12 Professional mula sa opisyal na mapagkukunan: http://www.abbyy.ru/finereader at magsanay sa loob ng 30 araw.

Ito ay mas mahusay kapag ang isa sa mga pinakabagong pro bersyon ay naka-install sa computer. Pagkatapos nito, inilarawan ang trabaho sa ABBYY FineReader 10 Professional Edition.

Kaya, sa mga nakaraang aralin, na-scan namin ang mga pahina gamit ang karaniwang mga tool sa Windows, binilang ang mga ito, nai-save ang mga ito gamit ang extension na "jpg" at inilagay ang mga ito sa isang hiwalay na folder na tinatawag na "Kasunduan".

Kaya, gamit ang mga kahanga-hangang kakayahan ng programa sa pagkilala, madali naming mai-convert ang iba't ibang mga imahe sa mga nae-edit na format.

Tungkol dito, mangyaring, sa susunod na aralin: Pag-scan sa ABBYY FineReader.

Kaya, binabasa namin ang mga araling ito at tingnan kung anong mga pakinabang ang ibinibigay sa amin ng programa sa pagkilala. Sa halip na nakakapagod at nakakaubos ng oras na pag-type mula sa isang libro o brochure, ini-scan lang namin ang mga kinakailangang page ng FineReader, i-edit ang mga ito, kung kinakailangan, at i-save ang mga ito sa napiling format. Kaya, maaari kang mabilis na mag-typeset, halimbawa, isang artikulo o isang abstract.

At kung paano i-scan ang mga pahina ng mga libro at i-digitize ang mga libro, nabasa namin sa paksa: Pag-digitize ng libro.

Upang tapusin ang paksa, ibuod natin: ang isang scanner na pinagsama sa isang programa sa pagkilala ay isang makatwirang kapalit para sa pag-type mula sa keyboard. Ang pagkakaroon ng isang bersyon ng papel - teksto na naka-print sa isang printer o sa isang palalimbagan, ini-scan lang namin ito sa halip na pumasok mula sa keyboard. Ang isa pang tanyag na lugar ng aplikasyon ng scanner ay ang pag-digitize ng iba't ibang mga naka-print na produkto - mga label, postkard, litrato, magasin, libro.

Ang digitalization ng mga dokumento ay ang pagsasalin ng mga dokumento sa digital form. Maaari mong i-digitize ang mga guhit, teksto at aklat. Ang aktibidad ng anumang karaniwang opisina o institusyon, maaga o huli ay humahantong sa edukasyon sa loob ng mga pader nito marami mga dokumento. Ang mga dokumento ay naka-imbak sa mga istante at sa mga desk drawer. Kukunin nila ang isang malaking halaga ng espasyo sa mga cabinet ng opisina at sa mga mesa ng mga empleyado ng opisina. Mga bundok ng dokumentasyon, kung saan napakahirap maunawaan, at halos imposibleng mabilis na mahanap ito o ang dokumentong iyon. Upang ang opisina ay hindi maging isang imbakan ng archival ng mga dokumento, at ang mga empleyado nito ay maaaring mabilis na magtrabaho sa anuman kinakailangang dokumentasyon, kailangan mong i-digitize ang lahat ng mga dokumentong makukuha sa kumpanya at ilipat ang mga ito mula sa papel patungo sa electronic form, gamit ang mga serbisyo ng pag-scan at pagkilala ng mga dokumento. Ang mga elektronikong dokumento ay mas madaling iproseso at iimbak. Hindi sila kumukuha ng maraming espasyo sa opisina. Hindi sila maaaring mawala o masira, at ang dokumento ay hindi mahahanap sa isang digitized na electronic archive, kung saan ang lahat ay naka-systematize at nakaayos sa mga bundle na mas madali kaysa sa isang malaking tumpok ng mga papel na nakaimbak sa isang closet ng opisina. Ang mga naka-digit na dokumento ay maginhawa din para sa paggamit kapag ang isang empleyado ng kumpanya ay pupunta sa isang business trip o para sa mga negosasyon. Ang isang maliit na flash drive sa kanyang bulsa ay maaaring maglaman ng buong archive ng mga dokumento ng kumpanya, at bibigyan siya ng pagkakataon, kung kinakailangan, upang mabilis na mahanap ang anumang kinakailangang dokumento. Napakaginhawa at praktikal na gumamit ng mga naka-digitize na dokumento, habang ang mga serbisyo para sa pag-digitize ng mga dokumento ay hindi sapat na mahal at magagamit hindi lamang sa malalaking korporasyon, kundi pati na rin sa maliliit na kumpanya at mga organisasyon ng badyet.

Pag-digitize ng mga guhit

Ang pag-digitize ng mga guhit, o bilang ito ay tinatawag ding vectorization, ay nagbibigay-daan sa iyo upang ilipat ang mga teknikal at arkitektura na mga guhit mula sa format ng papel patungo sa elektronikong format. Ang mga serbisyo para sa pag-digitize ng mga guhit ay maaaring makabuluhang gawing simple at mag-systematize ang sistema ng pag-iimbak ng archival ng dokumentasyon ng disenyo, at ito ay lubos na nauugnay para sa mga negosyong pang-industriya at mga institusyong pang-agham, gayundin para sa mga bureaus ng arkitektura at disenyo, pribadong arkitekto, mag-aaral, at lahat ng tao na, ayon sa mga detalye ng kanilang trabaho o pag-aaral, ay gumagana sa mga guhit. Bilang isang patakaran, ang pangunahing problema ng pag-archive ng dokumentasyon ng disenyo ay ang paghahanap para sa nais na pagguhit, ang mga kondisyon kung saan ang pagguhit na inilapat sa papel ng Whatman ay dapat na naka-imbak at ang pagiging kumplikado nito. Ang pag-digitize ng mga guhit ay maaaring epektibong matugunan ang mga isyung ito. Kapag ang isang guhit ay inilipat mula sa tagadala ng papel sa elektronikong format, para sa imbakan nito hindi mo kailangang magkaroon ng malalaking lugar ng archival, ngunit sapat lamang ang isang maliit na halaga ng libreng espasyo sa hard disk ng isang computer o anumang iba pang electronic medium. Kasabay nito, sapat na upang i-systematize ang mga nilalaman ng archive nang isang beses, sa pamamagitan ng pagpapalawak ng mga digitized na mga guhit sa mga pampakay na folder, at pagkatapos ay madaling makahanap ng anumang kinakailangang pagguhit. Ang mga guhit na nakaimbak sa electronic archive ay hindi napapailalim sa mekanikal na stress, o anumang iba pang natural na puwersa at elemento. Hindi sila maaaring basa, napunit o nawala, at salamat sa backup system, maaari mong isang daang porsyento na secure ang iyong sarili laban sa kanilang pagkawala o pagkawala. Ang mga naka-digitize na blueprint ay mas madaling gamitin kaysa sa kanilang mga katapat na papel. Mas maginhawang magdala ng laser disk sa iyo, kung saan palagi kang may access sa buong archive, kaysa sa dami ng malalaking papel at hindi maginhawang mga guhit. At upang ipakita ang pagguhit sa customer, na kung saan ay mas maginhawa sa isang computer monitor o laptop, ngunit walang unrolling multi-meter Whatman na papel sa kanyang mesa. Hindi sa banggitin ang katotohanan na ang digitized na pagguhit ay maaaring maipadala lamang ng e-mail, habang tinitipid ang iyong oras at oras ng taong nilayon ang pagguhit na ito. Ngayon, maraming mga kumpanya ang nagbibigay ng mga serbisyo para sa pag-digitize ng mga guhit, at nalulugod kaming sabihin ang katotohanan na ang aming kumpanya ay isa sa mga nangunguna sa larangan ng digitization ng mga dokumento. Ngayon ay mayroon na tayong lahat ng kinakailangang kagamitan at programa upang matiyak ang pag-digitize ng anumang pagguhit na may ganap na detalyadong pangangalaga sa kalidad nito.

Pag-digitize ng mga teksto

Ang digitization ng mga teksto ay isang paraan ng pagsasalin ng nakalimbag na teksto mula sa papel patungo sa elektronikong format. Ang pag-digitize ng mga teksto ay kailangang-kailangan bilang isang maginhawang tool para sa paglikha ng mga electronic archive at bilang isang tool para sa pagsasalin ng mga libro at aklat-aralin sa elektronikong format. Ngayon ang mga mahilig sa pampanitikan na salita ay hindi na kailangang umupo nang maraming oras sa mga aklatan o magdala ng mabigat at hindi komportable na libro. Sapat na ang pagkakaroon ng isang elektronikong tablet na madaling magkasya sa iyong bulsa o pitaka at magbasa ng anumang fiction o reference na literatura.

Pag-digitize ng mga libro

Ang pag-digitize ng teksto ay nagpapahintulot sa iyo na ilipat ang isang libro sa anumang laki sa digital na format. Ito ay napaka-maginhawa at praktikal. Bilang karagdagan sa kadalian ng paggamit, mayroong isang malinaw na benepisyo sa ekonomiya na sasabihin. Hindi palaging maaari kang bumili ng isa o isa pang aklat-aralin o libro para sa iyong sarili, at sa parehong oras maaari mo itong hiramin nang ilang sandali sa silid-aklatan o mula sa isang kaibigan, at salamat sa serbisyo ng digitization, maging may-ari ng elektronikong bersyon, paggastos mas kaunting pera para dito kaysa sa pagbili ng libro. Ang digitization ng mga libro ay lubos na pinasimple ang proseso ng pag-iimbak ng mga bihirang manuskrito at mga aklat na may halaga sa kasaysayan. Pagkatapos ng lahat, ang papel ay hindi magtatagal magpakailanman, ngunit ang elektronikong bersyon ng nakalimbag na salita ay talagang maiimbak sa loob ng libu-libong taon at hinding-hindi mawawala ang orihinal na nilalaman nito, na tiyak na pinapanatili hindi lamang ang teksto, kundi pati na rin ang mga guhit para sa susunod na henerasyon.

SCAN: Teknolohiya

Ano ang digitization?

02.10.2015, Biy, 14:05, oras ng Moscow 2707

Pag-scan, retro conversion at mga kaugnay na serbisyo. Pagsusuri ng mga teknolohiya para sa pag-convert ng mga dokumento sa electronic form.

Mayroong ilang mga opsyon para sa pag-aayos ng mga proseso ng digitization. Maaari silang isagawa nang nakapag-iisa o may outsourcing ng mga serbisyo, kasama ang pag-export ng mga dokumento o ang pagganap ng trabaho sa teritoryo nito. Kapag nagdi-digitize, maaaring gamitin ang opisina, propesyonal na dokumento o mga planetary scanner. Maaaring makuha ang data sa manu-mano, semi-awtomatiko o awtomatikong mga mode, na may paunang pagpoproseso ng archival ng mga dokumentong papel o pag-uuri ng impormasyon na nasa elektronikong anyo na, atbp.

Aling landas ang tatahakin?

Ang solusyon ay nakasalalay sa tiyak na gawain, dahil tinutukoy ng bawat isa sa itaas na "o" ang kalidad ng resulta at ang halaga ng trabaho. Halimbawa, ang pangmatagalang tanong ng mga naka-stitch na dokumento ay: mas kumikita ba ang mabagal na pag-scan sa isang stitched state, o gumastos ng pera sa pagsali, ngunit mabilis na mag-digitize sa mga scanner ng dokumento?

Ang pinakamadaling paraan upang piliin ang landas na pinakamainam para sa iyo ay ang humingi ng kadalubhasaan mula sa isang organisasyong digitalization. Interesado sa mga trabaho malalaking kumpanya ay magsasagawa ng isang survey nang walang bayad, at ang pinakamainam na diskarte ay matutukoy para sa iyo. Huwag pabayaan ang pagkakataong ito at huwag asahan na matuksong mag-order ng mga serbisyo: karamihan sa mga kumpanyang ito ay interesado rin sa pagbibigay ng kagamitan at software para sa self-digitization.

Ilang dokumento ang kailangan kong i-scan?

Ang pagtukoy ng parameter ay ang dami ng mga dokumento.

Ang pagtukoy ng parameter ay ang dami ng mga dokumento. Para sa pang-araw-araw na pag-scan ng mga maliliit na pakete ng mga burda na dokumento (halimbawa, pangunahing accounting), ang isang regular na scanner ng opisina ay angkop, na maaaring makatiis ng pagkarga ng ilang libong mga pahina bawat araw. Kailangan mo lamang itong dagdagan ng isang maginhawang programa sa pag-index.

Ang mga propesyonal na kagamitan ay kinakailangan para sa regular na pag-scan ng malalaking volume. Ito ay mga pang-industriyang scanner na nagkakahalaga ng malaking pera (katulad na kagamitan ang ginagamit ng Federal Tax Service, Federal Customs Service, at malalaking bangko). Samakatuwid, ang isang mas murang alternatibo ay maaaring isang balangkas na kasunduan para sa pagbibigay ng pana-panahong mga serbisyo sa pag-digitize.

Ang pag-convert ng malalaking retrospective arrays sa electronic form sa kanilang sarili ay hindi makatwiran sa ekonomiya: bilang karagdagan sa pagbili ng mga kagamitan at pagsasanay ng mga empleyado, kakailanganin ang malaking gastos sa paggawa at oras. Tiyak na mas mahusay na mag-order ng isang serbisyo, dahil ang isang malaking kumpanya ay maaaring maglaan ng isang malaking kawani at malutas ang problema nang mabilis.

Saan mag-scan ng mga dokumento?

Ang pagtukoy ng parameter ay ang pangangailangan para sa mga na-scan na dokumento. Ang negosyo ba ng organisasyon ay apektado ng pag-agaw ng mga dokumento sa oras ng pag-scan? Ito ay partikular na kritikal kapag nagdi-digitize ng mga dokumento na regular na tinutukoy ng mga empleyado, o maaaring biglaang hilingin ng awtoridad sa pangangasiwa, pati na rin para sa pag-aalis ng emergency na nauugnay sa mga dokumento. Mga halimbawa: pananalapi at mga dokumento ng tauhan, dokumentasyong teknikal at pagpapatakbo, mga aklat sa opisina ng pagpapatala at iba pang mga pondo sa industriya.

Ang lugar ng pag-scan na nakaayos sa lugar ng kumpanyang nag-order ng mga serbisyo.

Kung kailangan mong i-digitize ang mga ito nang sapat na mabilis, kung gayon ang tradisyonal na diskarte ay mag-order ng mga serbisyo sa pag-alis ng pangkat ng pag-scan sa iyong teritoryo. Kadalasan ito ay lumalabas na mas mura kaysa sa paghahatid ng mga dokumento sa produksyon at likod ng kontratista, ngunit ang lahat ay natutukoy ng liblib ng teritoryo. Ang timetable para sa field work ay nagpapahiwatig ng pag-scan sa ibinigay na file sa loob ng isa o dalawang araw ng trabaho, nang walang mahabang pag-alis mula sa proseso ng trabaho.

Kung magbuburda ng mga dokumento?

Pagtukoy ng mga parameter: ang estado ng mga dokumento at ang posibilidad ng pagsali. Kung may ganoong posibilidad, at ang papel ay angkop para sa broaching na may scanner ng dokumento, dapat itong burdado. Ang katotohanan ay ang pag-scan ng mga nakagapos na dokumento sa isang planetary (libro) scanner ay ilang sampu-sampung beses na mas mabagal kaysa sa pag-digitize ng stream. Ang oras ng trabaho at ang gastos ng paggawa ay proporsyonal na tumaas. Ang pag-scan sa mga scanner ng dokumento, kahit na isinasaalang-alang ang bridging, ay mas mabilis at mas mura.

Maaari mong burdahan ang iyong sarili, o maaari mong ipagkatiwala ito sa gumaganap.

Maaari mong burdahan ito sa iyong sarili, o maaari mong ipagkatiwala ito sa tagapalabas: kung pinili mo ang isang kagalang-galang na kumpanya, hindi ka dapat matakot na mawala ang iyong mga dokumento. Sa kabaligtaran, ang mahigpit na regulasyon ng lahat ng mga proseso at mga de-kalidad na materyales ay nagpapahintulot sa mga kumpanya na iseguro ang kanilang sarili laban sa karagdagang mga pagkalugi sa pananalapi at pinsala sa kanilang imahe. Ang diskarte na ito ay pinagkakatiwalaan kahit ng Mga korte ng Russia: Kapag nag-oorganisa ng pag-scan, kadalasan sa pamamagitan ng panloob na utos na pinapayagan ang pagsali at kasunod na pagtatahi ng mga kaso sa korte.

Sa pamamagitan ng paraan, ang mga malalaking kumpanya ay maaaring sabay na magsagawa ng propesyonal na pagproseso ng archival: una, ang bahagi ng trabaho ay ginagawa bilang paghahanda para sa pag-scan, at pangalawa, ang pagpoproseso ng archival ay tumutulong upang makilala ang mga hindi na-claim na mga dokumento at bawasan ang dami ng mga na-scan na array, na maaaring mabawasan ang gastos ng trabaho.

Aling kalidad ang pipiliin?

Anumang bagay ay maaaring i-scan nang may mataas na kalidad ngayon, mula sa maliliit na library card hanggang 8A0 card at theater set.

Pagtukoy ng mga parameter: ang uri ng dokumento at ang halaga ng natanggap na mapagkukunan sa elektronikong anyo... Sa ngayon, pinapayagan ka ng kagamitan sa pag-scan na makakuha ng mga larawang may resolusyon na 200 hanggang 1200 tuldok bawat pulgada (dpi). Para sa mga masining na gawa, karaniwang ginagamit ang isang resolution na 400-600 dpi, na nagbibigay-daan para sa mga de-kalidad na reproductions. Higit pa mataas na kalidad ito ay ginagamit lamang kapag ito ay kinakailangan upang palakihin ang imahe at detalye ng maliliit na bagay, halimbawa, mga barya.

Ang mga detalyadong at mababang-contrast na mga guhit, na kadalasang ginagawa sa tracing na papel at asul, ay nangangailangan ng pag-scan sa isang resolution na 300-400 dpi at karagdagang pagpoproseso ng imahe sa mga graphic editor. Ang natitirang mga dokumento ay karaniwang ini-scan sa 300 dpi, sapat na upang mag-print ng mga kopya nang hindi nawawala ang kalidad. Ang kinakailangang pag-crop ng mga imahe, geometric correction, color correction, conversion sa pdf, tiff, jpeg, atbp. ay maaaring isagawa sa ganap na awtomatikong mode gamit ang mga program na nakapaloob sa kagamitan sa pag-scan o ibinigay kasama nito.

Sa karamihan ng mga kaso, ginagamit ang color mode. Ito ay kinakailangan para sa lahat ng mga dokumento na naitama o nakatatak sa ibabaw ng teksto, upang matiyak na ang isang elektronikong kopya ay kinuha mula sa orihinal na dokumento na may selyo at lagda, pati na rin para sa pagiging madaling mabasa ng mga kumukupas na teksto at ang paghahatid ng mga natatanging tampok. ng orihinal. Ang pangangailangan para sa color scanning ng artwork ay hindi tinatalakay. Ang mode na "grayscale" ay ginagamit lamang sa ilang mga kaso: kapag ang mga dokumento ay walang mga katangian ng kulay, o kapag kinakailangan upang bawasan ang dami ng natanggap na mapagkukunang elektroniko.

Ang pag-scan ay maaaring gawin nang nakapag-iisa. Ang pangunahing gawain ay upang sanayin ang mga empleyado na magtrabaho nang tama sa mga kumplikadong kagamitan, dahil ang kalidad ng mga nagresultang imahe ay mahalaga para sa kasunod na pag-index: ang isang hindi magandang na-scan na dokumento, mga anino, flare at iba pang mga depekto sa isang elektronikong imahe ay maaaring gumawa ng mahalagang impormasyon na hindi nababasa. Pipigilan nito ang paggamit ng mga teknolohiya ng awtomatikong pagkuha ng data at maaaring humantong sa mga error sa pag-index. Naglo-load ng maling data sa ilang system ( mga rehistro ng estado, mga sistema ng accounting) ay hindi pinapayagan.

Pag-index

Ang simpleng pag-scan ay bihirang ginagamit, dahil sa kasunod na gawain ay magiging mas madali lamang ang paghahanap ng impormasyon sa isang hanay ng mga graphic na file kaysa sa pagbaling ng papel. Upang makapaghanap, kinakailangan na pumili ng ilang mga katangian (mga patlang ng index) sa dokumento.

Mga empleyadong kasangkot sa mass indexing ng mga dokumento sa pamamagitan ng manual input.

Maaaring idagdag ang mga naka-highlight na katangian sa pangalan ng file. Ang kasanayang ito ay binuo sa mga korte ng Russia: upang ang operator ng pag-scan ay walang access sa mga panloob na sistema ng hukuman, sa panahon ng pag-digitize, ang lahat ng kinakailangang mga detalye ay ipinasok sa pangalan ng file. Kasunod nito, ang mga detalyeng ito ay kinikilala ng sistema ng hukuman kapag naglo-load ng bawat dokumento nang hiwalay.

Ngunit kadalasan ang mga digitized na dokumento ay ina-upload sa sistema ng impormasyon grupo, na nangangailangan ng paglikha ng isang database. Kaya, kung kailangan mong mag-attach ng isang dokumento sa isang umiiral na card sa sistema ng accounting, sapat na upang kunin ang isang pares ng mga natatanging detalye ng pagtukoy - kadalasan ang numero at petsa.

Kung kailangan mong bumuo ng isang base ng paghahanap batay sa mga dokumento mismo, kung gayon ang dami ng data na nakuha ay tinutukoy ng gawain: mula sa ilang mga detalye para sa paghahanap ng isang file sa isang electronic archive hanggang sa paglilipat ng lahat ng nauugnay na impormasyon sa isang analytical database ( pangalan, address, TIN, KPP, petsa, numero ng mga dokumento ng aplikasyon atbp.).

Nalalapat ang mga panuntunan sa pag-index sa mga museo, aklatan, at archive kapag nagdi-digitize ng mga unit at talaan ng imbakan. Ang isang hiwalay na linya ng mga serbisyo ay vectorization din, na ginagamit, lalo na, kapag nagdi-digitize ng mga logging tape (awtomatikong) at mga guhit (manu-manong pagguhit sa mga CAD system).

Gaano karaming data ang kukunin? Ang sagot sa tanong na ito ay mas mahusay din na gamitin ang kadalubhasaan, dahil ang bilang ng mga nakuhang detalye ay nakasalalay sa functional na gawain at higit na tinutukoy ang halaga ng digitization. Sa ilang mga kaso, maaari mong limitahan ang iyong sarili sa mga koleksyon ng mga dokumento, kapag ang mga elektronikong imahe ay pinagsama sa ilalim ng auspice ng pangunahing dokumento (halimbawa, isang kontrata o isang rehistro ng mga account). Sa iba, kinakailangang kunin ang lahat ng data na nakapaloob sa dokumento upang punan ang card ng system ng impormasyon.

Mga halimbawa ng nakuhang data

Pagsusuri ng mga order na inilagay sa portal zakupki.gov.ru mula sa mga kumpanyang may partisipasyon ng estado at mga ahensya ng gobyerno (44-FZ, 223-FZ), ay nagpapakita na:

- Upang maiugnay ang mga elektronikong kopya ng OSA sa sistema ng pamamahala ng elektronikong dokumento, sapat ang numero, petsa at uri ng dokumento.

- Ang pag-scan ng mga dokumento sa pananalapi ay madalas na sinamahan ng pagkuha ng mga numero, petsa, pangalan at detalye ng mga nagbabayad, mga halaga.

- Ang pag-digitize ng mga dokumento ng archival ng mga munisipalidad (mga desisyon ng mga administrasyon, mga komite ng ehekutibo ng lungsod, mga konseho ng nayon, atbp.) upang makapagbigay ng mga serbisyo at imbentaryo ng mga bagay sa mga relasyon sa lupa at ari-arian ay nangangailangan ng pagkuha ng numero at petsa ng dokumento, lahat ng mga pangalan at mga address na nakatagpo. Bukod dito, ang mga address ay dapat ihambing sa kasalukuyang mga direktoryo ng KLADR / FIAS.

- Ang pag-digitize ng mga dokumento mula sa Archive Fund ng Russian Federation ay sinamahan ng mahigpit na pagkumpleto ng NSA at isang paglalarawan ng mga pondo alinsunod sa batas ng archival.

- Ang pag-index ng mga imbentaryo at mga rehistro ay nagpapahiwatig ng pagkilala sa lahat ng mga ordinal na tala.

- Upang gumana sa mga guhit sa elektronikong anyo, kinakailangan upang kunin ang halos lahat ng mga patlang ng selyo.

- Ang pag-scan ng mga compound cases ay nangangailangan ng hindi lamang pagkuha ng mga detalye ng bawat dokumento, kundi pati na rin ang pagtatatag ng mga relasyon. Ang pinakamahirap ay ang kaso ng dokumentasyon ng disenyo, kung saan ang nabuong database ay mayroong multilevel na hierarchy at mga link ng dokumento.