Характеристики на цифровизацията на документи в съвременните архиви. Дигитализация на хартиени архиви Цени за архивни услуги

В офиса често се налага изпращане на копия по електронна поща – електронни версии на печатни документи. Това могат да бъдат различни актове, фактури, писма, договори, харти, служебни бележкии всякакви други възможни документи.

Вкъщи имаме стари снимки, които се окаляха през годините и бихме искали да ги запазим.

За известно време ни подариха интересна книга, но искаме да я имаме с нас. Как да направя всичко? Нашите краткотрайни хартиени документи трябва да бъдат преобразувани в електронен вид, тоест дигитализирани и съхранявани.

Дигитализацията е преобразуване на изображение или аналогов аудио/видео сигнал в цифров формат, подходящ за запис на електронен носител.

За дигитализиране на изображения на обект има специални устройства - скенери. Има скенери за баркод, филмови скенери. Биометричните скенери разчитат модела на ретината на окото или папиларния модел на кожата на пръстите. Формата на триизмерен обект се чете от триизмерен 3D скенер.

В скенери за обработка на хартиени носители - рисунки, фотографии, текстови документи, изображението се осветява ред по ред със специална лампа, а отразеният светлинен поток се фокусира върху фоточувствителна матрица. Аналогово-цифровият преобразувател преобразува получените електрически сигнали в двоична система от данни, която образува цифрово копие на изображението.

Изборът на скенер зависи от задачите и спецификата на неговото приложение. Скенер в офис почти винаги се използва за дигитализиране на документи. Дори снимките да са сканирани, те не са обект на изисквания за високо качество в офиса. Разделителната способност от 300 dpi е напълно достатъчна, за да се гарантира точната работа на програмите за разпознаване и да се получи добро четим текст. Всеки скенер, произведен днес, осигурява резолюция, приемлива за работа в офиса.

Това важи и за дълбочината на цвета. Почти всеки модерен скенер възпроизвежда нивото на сив цвят, необходимо за отпечатани документи.

Важно е в офиса, където основната задача е бързо да се дигитализират текстови документи страница по страница, това е автоматизацията на процеса на сканиране. Могат да се използват листови скенери. Тук лист документ се вкарва в слота на машината и се изтегля, както при факс машина, по направляващите ролки. Такъв скенер е удобен с вградено автоматично устройство за подаване на листове. Зареждаме няколко листа от многостраничен документ в тавата и докато скенерът дигитализира, едновременно с това правим нещо друго. Тук всичко е просто. Ако е инсталиран съответният софтуер за OCR, едно натискане на бутон е достатъчно, за да се дигитализира и запише документ в желания формат на такъв скенер.

Модерно офис решение за отдел на инженерингова компания, например, може да бъде A3 скенер, включен в мултифункционално устройство заедно с A3/A4 принтер. На такова MFP е удобно да се дигитализират и правят копия на чертежи.

Ясно е, че няма да работи да сканирате подвързано списание или разпространение на книга на листов скенер.

За сканиране на двустранни документи има дуплексни скенери, при които два сканиращи елемента обработват двете страни на листа с един проход.

Добро решение за дома е цветно мастиленоструйно MFP. MFP е многофункционално устройство, което включва скенер и принтер. Такова устройство е и копирна машина. Тоест, MFP може автоматично да сканира документ и да отпечата копие от него - да създаде фотокопие на документа.

Компактното устройство с комбинирани функции заема по-малко място на масата. Цената му ще бъде значително по-ниска от общата цена на включените в него устройства, ако ги закупите отделно. На цветен мастиленоструен принтер правим висококачествени цветни снимки и визитки, а с плосък скенер дигитализираме документи, фотоалбуми или необходими книги.

В следващите уроци ще научим как ръчно да дигитализираме, конвертираме и запазваме текстови документи на плосък скенер, страница по страница.

В тези примери използвах популярно настолен MFP формат A4 за сканиране. Такова евтино устройство е най-доброто решение за дома и може да бъде второ, допълнително MFP в офиса.

Да предположим, че имаме многостранична логически свързан документ, който трябва да бъде дигитализиран и изпратен по имейл до нашия контрагент. Да го наречем "Договор".

В нашия любим Windows XP има стандартен „Помощник за скенер или цифров фотоапарат“. За да работи съветникът, скенерът трябва да е инсталиран на компютъра и да е активиран. Работата в съветника е много проста и има малко ръководство в урока Digitizing Documents in Windows XP.

В Windows 7 инструментът за създаване на електронни копия на отпечатани документи и изображения е стандартният компонент за факс и сканиране на Windows.

И така, прочетохме уроците и с помощта на една от тези програми получихме сканирани файлове на страниците на нашия договор в една от графични формати, запазени и моля, прикачете ги към имейл, изпратете на адреса.

Лошото тук е, че когато сканираме многостраничен документ с тези програми, няма да можем да комбинираме сканираните страници в един файл. Разбира се, можете да номерирате файловете на страниците по ред и да ги затворите, за да можете да ги изпратите компактно. Но нашият адресат ще може да разглежда страниците на свой ред само в графичен редактор, без да може да навигира в документа. Неудобно е и губи време. И като цяло неприемливо.

Всъщност, използвайки тези инструменти, ние получаваме отделни цифрови снимки на страниците на документ.

За да преобразуваме нашите разпръснати сканирания в единичен документс възможност за търсене в пълен текст, имате нужда от програма за разпознаване на текст. Най-доброто за днес е FineReader.

FineReader е програма руска компания ABBYY. Най-новата версия 12 на ABBYY FineReader беше пусната през февруари 2014 г. Тази програма извлича текстови данни от цифрови изображения - разпознава текстови знаци. Версията за оценка на ABBYY FineReader 12 Professional може да бъде изтеглена от официалния ресурс: http://www.abbyy.ru/finereaderи тренирайте 30 дни.

По-добре е, когато една от най-новите професионални версии е инсталирана на компютъра. Тук и по-долу е описана работата в ABBYY FineReader 10 Professional Edition.

И така, в предишните уроци сканирахме страниците със стандартни инструменти на Windows, номерирахме ги, записахме ги с разширението „jpg“ и ги поставихме в отделна папка, която нарекохме „Споразумение“.

Така че, използвайки прекрасните функции на програмата за разпознаване, можем лесно да конвертираме различни изображения в редактируеми формати.

Повече за това, моля, в следващия урок: Сканиране в ABBYY FineReader.

И така, ние четем тези уроци и виждаме какви предимства ни дава програмата за разпознаване. Вместо досадно и отнемащо време да пишете от книга или брошура, ние просто сканираме необходимите страници с FineReader, редактираме ги, ако е необходимо, и ги запазваме в избрания формат. Така че можете бързо да съставите например статия или резюме .

А как да сканираме страниците на книгите и да дигитализираме книги четем в темата: Дигитализиране на книга.

В заключение, нека обобщим темата: скенер в комбинация с програма за разпознаване е рационален заместител на писането от клавиатурата. Имайки хартиен вариант – текст, отпечатан на принтер или в печатница, вместо да въвеждаме от клавиатурата, ние просто го сканираме. Друга популярна област на приложение на скенера е дигитализацията на различни печатни продукти - етикети, пощенски картички, снимки, списания, книги.

В момента все повече внимание се обръща на проблемите на културна ценност. В тази връзка се одобрява правителствени програми, в рамките на които, според замисъла на техните създатели, използването на нови технологии, иновативни подходи, както и световния опит ще гарантират безопасността на културното наследство, исторически значими документи. Ето защо днес архивите на Русия се превеждат хартиени документи v електронна форма. За това какво беше началото на тази мащабна работа, с какви трудности се сблъскват архивистите и как решават проблемите със запазването на дигитализирани документи, заместник-ръководител на Федералната архивна агенция (Роархив) Олег Наумовказа пред кореспондент на PC Week/RE Олга Звонарева.

PC Week: Моля, кажете ни как започна процесът на цифровизация архивни документиКакви са характеристиките на тази работа?

Олег Наумов:Задачата за масово преобразуване на архивни документи в електронен вид беше поставена в програмата „ Информационното общество(2011-2020)”. Това никак не е лесна задача. Освен това едно е да се дигитализират документи, а друго е да се дигитализират научна справочна апаратура(NSA), без който не може да се намери изискуем документ. Ето защо, когато преди две години възможността за нормално финансиране на работа в рамките на федералната целева програма„Култура на Русия 2012-2018“, на първо място, те започнаха да създават NSA в електронен вид, което ви позволява ефективно да търсите документи.

PC седмица: Какво софтуеризползван за това?

ТОЙ.:Много преди приемането на програмата „Информационно общество“ Федералните архиви започнаха разработването на общоруския стандартизиран софтуер за организиране на счетоводство на документи - софтуерния пакет „Архивен фонд“. собствена система Руска федерация, въведен на ниво федерални, регионални и общински архиви. С неговото използване беше създаден централен каталог на запасите, хостван на портала Архиви на Русия. Първоначално Архивният фонд е създаден като счетоводен апарат, но след това започва да се използва като апарат за търсене. Сега редица архиви използват специализирани търсачки.

PC Week: Какъв архивен опит беше основен при дигитализацията на инвентарите?

ТОЙ.:Руският държавен исторически архив в Санкт Петербург пръв дигитализира всички инвентаризации, единствено поради обстоятелствата. Когато възникна въпросът за преместването му, описите бяха сканирани, а електронните им изображения бяха използвани на всички етапи от преместването, тоест всяка кутия, всеки случай беше проследен.

Беше добър опит, но от гледна точка на развитието на информационните технологии не беше много успешен. Въпреки че стана възможно запознаването с тях в читалнята и онлайн, колекцията от графични изображения не позволява автоматизирано търсене. Където по-голямо удобство се предоставя на потребителите чрез инвентаризации, преведени във формат на база данни, с възможност за лесно и разширено търсене. Росархив започна активно да финансира тези произведения. Към днешна дата са направени около 20-30% от описите на федералните архиви.

PC Week: С какви предизвикателства се сблъскват архивите при дигитализирането на документи?

ТОЙ.Първият проблем е големият обем. Общият обем на Архивния фонд на Руската федерация е 494 милиона файла, от които 9% са във федерални архиви.

Но най-трудното е да се определи кои документи трябва да бъдат дигитализирани. Най-простият отговор е най-търсеният. И как да определим това търсене? Днес имаме нужда от едно, утре от друго. И в съветско времевъведено е понятието за особено ценни архивни фондове и документи. Създават застрахователен фонд на микрофилм, както и фонд за ползване. Днес обаче тези документи практически не се търсят. Тоест критериите за стойността и търсенето на документи от съветската епоха сега изобщо не работят. Търсенето непрекъснато се променя. Почти невъзможно е да се определи със сигурност кои документи ще бъдат най-търсени.

Техническата страна на въпроса също е важна. Например, имаше огромно търсене за съставяне на собствени родословия. Това е добре и необходимо. Те започнаха активно да поръчват тези дела: енорийски регистри, ревизионни приказки. Но те абсолютно не са пригодени за такава масова употреба. Сканирането им като най-популярни е глупост. От книга с дебелина 80 см на човек му трябва само една страница. И за да посрещнете това търсене, трябва да сканирате цели хиляда страници. Да, дори и с оборот. Но, от друга страна, ако тези документи се сканират, тогава оригиналите се изваждат от обращение и тяхната физическа безопасност е гарантирана. Всички те са уникални. И най-важното е, че злощастните пазители (включително много жени) няма да носят всички тези тонове документи на ръце.

Тук обаче попадаме във формата на предоставяне на информация. В крайна сметка за потребителя беше много по-интересно да получи не изображение, а декриптиране и база данни. И масивът от тези документи е огромен. Само в RGADA във фонда 350 "Ландратски книги и ревизионни книги" - повече от пет хиляди дела, около 3 милиона стр. Колко души трябва да бъдат включени? В Перм те намериха добър изход: привлякоха финанси, които бяха отпуснати за осигуряване на работни места. Работата е извършена от хора вкъщи. Успешно решен проблемът с безработицата. И в крайна сметка успяха да направят това, което никой друг в Русия, по моя памет, не можеше да направи.

Опитът от сканиране във федералните архиви ни позволява да направим два извода. Първо, създаването на електронен фонд за използване без създаване на NSA е непродуктивно занимание. Оказва се огромна купчина сканирания, където е невъзможно да се намери правилният. Второ, сканирането, особено масовото сканиране, е целесъобразно за разкриване на завършени комплекси – фондове или инвентари. В същото време делата трябва да се сканират изцяло, за да се избегнат конфликти при грешки в номерацията. V отделни случаи, поради уникалността и значимостта на документите, независимо дали има текст на гърба на листа или не, е необходимо да се дигитализира листа, включително и на гърба. Тогава въпросът, че може да сме скрили нещо, изчезва.

Има проблем с избора на оборудване. Някъде се нуждаете от обикновен скенер, някъде трябва да е по-сложен. Например, за дигитализацията на книгите на Landrat беше специално поръчана „дълбока люлка“. В противен случай не копирайте, защото дебелината на гръбнака на някои книги достига 80 см.

PC Week: Каква е основната цел на дигитализацията в момента?

ТОЙ.Има три от тях. Първият е разширяването и опростяването на достъпа до документите на Архивния фонд. Втората е да се гарантира безопасността на оригиналите чрез изтеглянето им от обращение и предоставянето на достъп до електронния фонд за ползване. Третото е опростяването на предоставянето на обществени услуги. Сега има много индивидуални искания от граждани за документи за персонал. Архивите също започват да ги дигитализират и използват електронни копия за подготовка на отговори, което значително ускорява работата.

PC Week: Как архивите дигитализират документи?

ТОЙ.Процесът протича по различен начин: някъде те го правят сами, използвайки импровизирани средства или придобивайки различно оборудване. Вторият начин е да се включат външни организации. Но все още няма еднозначен отговор на най-важния въпрос: към какво се стремим с дигитализирането на документи?

PC Week: И никой не ги пита?

ТОЙ.Защо, всеки пита. Но как да намерите единствения правилен отговор? Разбира се, предимството на използването на дигитализирани документи е очевидно. Това и сигурност, и отдалечен достъп, и лекотата на предоставяне на информация, и лекотата на правене на копия - пълен набор от плюсове. Друго нещо е как да се постигне това? Тук вие сте потребител, влязохте в сайта и определихте, че документите, от които се нуждаете, са на склад. Да речем в Перм. Отидохме до сайта чрез връзката, намерихме описания на случаи. Има интересен въпрос. И как да го получите? Е, ако вече е дигитализиран. И ако не? Отидете сами в архива и поръчайте оригиналите? Или архивът трябва да дигитализира всички дела? Но това е нереално. Така че всъщност остава само една опция. Създаване във всеки архив на възможност за бързо производство на електронни копия по искане на потребителя. И не е задължително да е ваша собствена единица. Може да бъде и аутсорсинг. Но такава услуга трябва да бъде предоставена своевременно. Но да се правят тези копия, както показва опитът, има смисъл само когато вече има електронна система, което ще позволи качествено и структурирано поставяне на тези материали. Тогава ще проработи. Кога ще го направим и дали ще успеем да го направим, честно казано, не знам.

PC Week: Вероятно още преди одобрението на програмата за информационно общество през 2010 г. вече е била извършена работа по дигитализацията?

ТОЙ.да. Имаше отделни проекти. Например Електронният архив на Коминтерна или сборник от документи от СВАГ. По правило те се изпълняват съвместно с чуждестранни партньори. Собствените средства за тяхното изпълнение не бяха достатъчни. Въпросът не беше лесен. Имаше технически, методически, организационни и технологични затруднения. Но опитът се натрупва. И сега е много полезно.

PC Week: Тоест, след одобрението на програмата, те започнаха да определят какви трябва да бъдат основните критерии за цифровизиране на документи?

ТОЙ.Тази програма, да речем, позволи на архивистите да насочат вниманието на властите към факта, че има проблем и той трябва да бъде решен. Подготвя и одобрява програми за дигитализация. И да привлечете финансиране за това. Но днес няма универсален критерий. Трудно е да се определи единен подход за всички, тъй като архивите съхраняват напълно различна документация.

PC Week: Значи всеки архив всъщност сам определя критериите?

ТОЙ.Всъщност да. По принцип това са четири критерия, общоприети са, но няма да кажа, че са най-правилните. Това е търсенето на документи, осигуряване на безопасност, улесняване на работата на служителите в архива, подобряване на условията за обслужване на потребителите. Освен това ускорява работата. Ако имам електронен NSA на моя сайт, тогава потребителят идва в архива, подготвен чрез разглеждане на инвентара в Интернет. Ако необходимите документи вече са дигитализирани, той има възможност да ги разгледа на компютъра си, без да отива в архива, или да ги получи в читалнята без забавяне.

PC Week: Оказва се, че всеки архив трябва сам да реши какво да дигитализира на първо място?

ТОЙ.Съвсем правилно. Това трябва да бъде изключително индивидуална програма за всеки архив. Не можете да направите такъв. Зависи от много фактори: от финансовите възможности, от степента на развитие и внедряване на ИТ технологиите, от конкретното търсене. Така че някой е в голямо търсене на документи за персонал и е необходимо да се задоволят нуждите на гражданите. Макар и от архивна гледна точка, тези документи не са постоянни, а имат временен срок на съхранение от 75 години. Но това улеснява работата и помага на хората, защото човек не чака един месец отговор на заявка, а получава необходимата информация за два дни. Така че е необходимо да се инвестира в тези усилия и ресурси.

PC Week: Когато се определят приоритетите на документите, които ще бъдат дигитализирани, архивите съгласуват ли ги с руските архиви?

ТОЙ.Ако говорим за регионални архиви, тогава не. Това е работа на всеки архив. Изпращат ни програмите си за информатизация и дигитализация. Ние ги опознаваме и даваме нашите съвети. Помагаме им по силите си, отпускаме средства от FTP. Друго нещо са федералните архиви. Тук позицията на Руския архив е от решаващо значение. Но дори и тук няма универсален критерий. За да отговори на постоянно нарастващото търсене на генеалогична информация, Руският архив отпусна повече от 40 милиона рубли. за прехвърляне на ландрат книги, съхранявани в РГАДА в електронен вид. В отговор на постоянния интерес на обществото към историята на нашето отечество в близкото минало, през юни тази година стартира сайтът „Документи от съветската епоха“, където изображения на документи от личния фонд на IV Сталин и Политбюро на централният комитет са изпратени. Бяха подготвени интернет проекти, посветени на 1150-годишнината руската държавност, 400 годишнина от края на смутите, 200 годишнина Отечествена война 1812 г. Естествено там бяха публикувани изображения на най-важните и популярни документи.

PC Week: Значи сега в читалнята на архива ще се издават само електронни копия, а не оригинални документи?

ТОЙ.В идеалния случай имате нужда от човек, който да намери документа, който търси в сайта, да поръча случай и ще му бъдат предоставени сканирани документи. И оригиналът остава непокътнат. Има обаче случаи, когато трябва да видите оригинала. Например, колкото и добра да е техниката, тя няма да предаде водни знаци. И върху тях можете да зададете датата на документа. Но такива случаи са един на хиляда.

PC Week: Оказва се, че архивът е предоставен на потребителя обществена услуга, но след като дигитализираното копие на документа трябва да бъде запазено?

ТОЙ.Разбира се, това е предимството на сканирането. Преди имаше микрофилми, ксерокс, машинопис. И архивистът, като направи копия, ги даде на потребителя. Тоест не е имал копие от документа. В случай на дигитализация остава копие. Но за него мястото на съхранение трябва да бъде ясно определено. И ако има второ искане по-късно, няма да има нужда от повдигане на делото. Трябва да натрупате опит в този вид работа.

PC Week: Как се определят сроковете за дигитализиране на масиви от документи?

ТОЙ.Сроковете зависят от три причини: от технически и финансови възможности и от състоянието на документите. Има документи, които са подвързани по такъв начин, че дори най-модерната технология не може да получи напълно текста. Тоест ще трябва да бъдат бродирани, което не харесва нито документите, нито архивистите. Сканиране. След това шийте обратно. Отнема време. Също така сроковете зависят от обема на делата, от броя на листовете в тях. Не е толкова трудно да сканирате купчина документи в стандартен формат, но карта 3x8 m вече е по-трудна. По счетоводни документи това е един лист. Но се сканира само на части. И след това в софтуера трябва да го „зашийте“ всичко, да го коригирате и да видите как ще изглежда този документ.

PC Week: Как върви работата по изпълнението на 89-та точка от федералната целева програма „Култура на Русия (2012-2018): формиране на архивни електронни ресурси и тяхното предоставяне в Интернет“?

ТОЙ.Като част от изпълнението на тази позиция инвентаризацията се дигитализира. Документите също се дигитализират, включително ландрат книги. Освен това се опитваме да помогнем и на регионите: включваме около пет-шест региона годишно в тази програма и отделяме от 10 до 15 милиона рубли. Създаваме онлайн изложби и др. Общо 67 милиона рубли се отделят годишно за изпълнение на работата по тази програма.

PC Week: Разпределението на средствата зависи ли от степента на важност и значимост на документите?

ТОЙ.да. Архивите подават заявки в определена форма за участие, ние разглеждаме тези заявки. Също така се прилагат фирми, които вярват, че предлагат интересни неща. Ние ги разглеждаме, избираме интересни обещаващи решения, съставяме общ план и извършваме покупки на конкурентна основа. Миналата година имаше 52 държавни поръчки за това събитие. Тоест всяка седмица подписвахме договор.

PC Week: Засегнахте темата за документите, които вече се съхраняват в архивите, започвайки от 11 век, но нови документи на хартиен носител също идват в архивите и това е огромен масив. Как се работи с тях? Как се решава въпросът с тяхното цифровизиране?

ТОЙ.За нас е важно само едно: дали тези документи принадлежат към състава на архивния фонд или не. Тоест, те подлежат на постоянен срок на годност или не. И тогава, от гледна точка на употреба, изобщо няма значение дали това са документи от 11-и или 21-ви век. В това отношение те са равни. Друго нещо е, че естествено имаме осигурителен фонд и фонд за ползване на документи от 11 век. И тези уникални документи се раздават изключително рядко. Има специална Държавен регистъруникални документи на Руската федерация, които са публикувани на уебсайта на Федералния архив и съдържат техните описания и електронни изображения.

PC Week: В тази връзка по-лесно ли е да се приемат за съхранение документи, преведени в електронен формат? Например промените в законодателството относно документацията на персонала влязоха в сила и архивите вероятно могат да я приемат в електронен вид?

ТОЙ.предполагам, да. Но сега няма особен смисъл държавният архив да приема съвременни документи за личния състав. За какво? Изчислете ли пенсията си? Има Пенсионен фонд, която създаде специализирана регистрация на граждани, от 2000г.

PC Week: Значи архивите не приемат записи, които са на 75 години?

ТОЙ.Не, пазим го дълго време. И сега водим активни преговори със същия Пенсионен фонд, за да намалим този период за хартиените документи от 75 на 15 години. Но пенсионният фонд се опасява, че електронната им система може да се срине.

А тези документи, които в крайна сметка ще дойдат при нас в електронен вид, са много голям и напълно отделен проблем. Това са въпроси относно електронно управление на документи, електронни документи. Как да ги приемате, как да ги съхранявате, е отделен въпрос.

PC Week: Все още не сте получавали такива документи?

ТОЙ.Не, те го правят. Материалите от преброяването на населението и земеделското преброяване са приети от ГАРФ в електронен вид. Друго нещо е, че тези преброявания съществуват само в електронен вид. Но все още няма масово приемане на бизнес документация. Тук има доста нерешени проблеми.

PC Week: А какво ще кажете за документите на ликвидирани организации? Приемат ли се за съхранение?

ТОЙ.Приемаме. Вярно е, че в случай на несъстоятелност и ликвидация на дружество, синдиците са длъжни да намерят пари, за да опишат документите на ликвидирани организации, но не винаги ги намират.

PC Week: Федералният архив управлява 15 федерални архива. Регионален архив в понастоящемпремахнати от контрола на вашия отдел?

ТОЙ.Да, няма пряк контрол върху тях. Те се подчиняват изпълнителни органисубекти на федерацията. Някъде това са независими архивни служби. Някъде и те като нас са включени в министерствата на културата. Някъде – в Министерството на правосъдието или директно в кабинета на губернатора. Но вертикалата на властта, която съществуваше в Съветския съюз и продължи до 2004 г., за съжаление, вече не съществува. Докато поддържаме методологическо единство. Как можем да помогнем на регионалните архиви. Представители на Федералните архиви участват в ежегодни събития, провеждани във всеки от тях федерален окръгнаучно-методически съвети. Веднъж годишно се провежда Архивният съвет, на който се събират архивисти от цялата страна. Тоест връзките остават. Шегуваме се, че архивистът е професия, в която във всеки град можеш да се окажеш без пари и неща, да дойдеш при колеги архивисти и те ще те приемат, хранят и изпращат у дома. Има братство, което всъщност не е характерно за никоя друга професия.

PC Week: Благодаря за чата.

21.01.2016 г., четвъртък, 17:51 ч., московско време, текст: Павел Притула 3068

Преобразуването на исторически документи в електронен вид и формирането на бази данни на базата на архивни описи е един от най-трудните видове дигитализация, изискващ специално оборудване, технологии и внимателно отношение към оригиналните документи.

Както във всички други отрасли на държавната и търговска дейност, дигитализацията на фондовете в държавните и общинските архиви служи за решаване на няколко проблема наведнъж: подреждане на нещата в складовото счетоводство, опростяване на търсенето на документи, намаляване на тежестта върху служителите и времето, когато обработване на потребителски заявки, запазване на овехтели оригинали, до предоставяне на архивни услуги в електронен вид, включително платени услуги.

Работата по прехвърлянето на архивни фондове в електронен вид започва в началото на хилядолетието. За времето, изминало оттогава руски архивидигитализирани са стотици хиляди исторически документи и описи. Но все пак това е само малка част от Архивния фонд на Руската федерация.

Два подхода

1. Ако условно си представим фондовете на архивна институция под формата на пирамида, тогава основният му обем ще бъдат самите документи, а само малка част в горната част е научно-справочният апарат (инвентар), който осигурява навигация във фондовете и търсенето на необходимите дела и документи.


Много институции използват дигитализацията за решаване на еднократни, тесни задачи. По аналогия с въвеждането на много софтуерни продукти за всяка малка задача, такава дигитализация се нарича "пачуърк". Например, във връзка с годишнината на значима за субекта на Руската федерация личност се очаква повишаване на интереса на изследователите към архивните документи. Архивът получава финансиране, сканира тези фондове и преобразува съответните описи във формат на база данни 2-3.

Например, във връзка с годишнината на значима за субекта на Руската федерация личност се очаква повишаване на интереса на изследователите към архивните документи. Архивът получава финансиране, сканира тези фондове и преобразува съответните описи във формат на база данни 2-3.

Този път е несистематичен подход, който ви позволява да отчитате извършената работа за кратък период от време, но не засяга цялостната ефективност на архива, тъй като общият обем документи, прехвърлени в електронна форма, е част от процента от средствата на институциите. Много архиви тръгват по този път единствено поради липса на финансиране. Но мнозинството все още разбира, че е необходима дългосрочна, планирана работа.

2. Поради това много от тях преследват дългосрочни програмни бюджети и следват различна стратегия, която е много по-обещаваща по отношение на развитието на архивни услуги и онлайн услуги. Тази стратегия се подкрепя и от Федералната архивна агенция (Росархив).


Приоритетно е прехвърлянето на цялата научна и справочна апаратура в електронен вид. Този път ви позволява да преминете към пълноценно автоматизирано отчитане на средства, включително създаването на унифицирани информационни системиза регионални архиви.

Освен това има възможност за лесно и удобно търсене на фондове, което улеснява вътрешните дейности и ви позволява да преминете към предоставяне на архивни услуги в електронен вид.

Документите се сканират в текущия режим при получаване на заявки от потребителите. За да направите това, достатъчно е архивът да има поне един професионален скенер. Но за дигитализацията на големи масиви, инвентари, както и на особено ценни документи, все още се включват експерти от организации, специализирани в сканирането и ретроконверсията.

Спецификата на цифровизирането на архивни документи

Сега нека разгледаме по-отблизо някои от характеристиките на сканирането и индексирането на архивни документи и описи. За разлика например от репликираните книги, почти всеки документ в архивите е уникален. Огромна отговорност пада на сканиращия оператор, който трябва да види специалното състояние на документа (разваляне, повреда, оставяне на текста в гръбнака, специални шевове и др.) и своевременно да настрои оборудването или да прехвърли документа за възстановяване.

Един от често сканираните видове архивни фондове е геодезията. Това е стандартен архивен документ с дебел гръб. Сред листовете му обаче има прикачени файлове с формат до А0. Не можете да бродирате неща, не можете да използвате техниката на протягане. Изпълнителят трябва да разполага с различен клас оборудване - широкоформатни скенери от планетарен тип (пример).

Опитът, който се включва в работата в институцията, придобива много висока стойност. Както показа дългогодишната практика, честото преконфигуриране на оборудването, необходимостта от следене на качеството на оригиналите и получените електронни изображения в реално време не са по силите на начинаещите в дигитализацията. Ако такава компания спечели конкурса, съществуват големи рискове от значително увеличаване на времето на проекта или получаване на ресурс с ниско качество (следователно е необходимо да се проверят добре подготвените електронни изображения при предаване на работата).

Оборудване

Особеностите на документите поставят симетрично високи изисквания и към оборудването. За архивни документи можете да използвате само технология за безконтактно сканиране – планетарни скенери.

Освен това скенерът трябва да има най-високите характеристики на разделителна способност, възпроизвеждане на цветовете и контраст, тъй като има голямо присъствие на нисък контраст, избледняващи текстове и изображения. Какво оборудване е популярно на пазара на планетарни скенери, можете да намерите в нашия преглед за 2014 г.

Първият такъв скенер е разработен от ELAR като част от проекта за дигитализация на фонд 350 „Ревизионни приказки и изповедни листи“ на Руския държавен архив на древните деяния. За сканиране на овехтели оригинали с височина до 50 см и тегло до 50 кг, скенерът е оборудван с моторизирана поставка. Безопасното ниво на сила на притискане към стъклото се контролира от няколко сензора.

Специалната структура, дебелина, тегло на архивните документи понякога водят до необходимостта от разработване на специално оборудване. Така в повечето държавни архиви сред търсените генеалогични фондове има случаи с дебелина над 30 см и тегло до 60 кг: например материали за преброяване на населението (преброителни книги), документи за раждане на църковни енории, и др. Дълго време, въпреки че бяха търсени, тези средства не бяха сканирани поради липса на оборудване. Подходящите скенери се появиха на пазара едва в края на 2013 г., но днес те вече придобиха популярност.

Индексиране

За да водите записи и да можете да търсите документи, те трябва да бъдат индексирани - попълнете карти в AIS. Повечето архивни документи и описи се правят ръчно или с пишеща машина, тоест не подлежат на висококачествено софтуерно разпознаване. Изисква ръчна ретроконверсия.

Появи се отново Допълнителни изискванияна изпълнителя. Първо, той трябва да разполага с достатъчно персонал, за да завърши работата навреме. В най-мащабните проекти за дигитализация на архивните фондове днес участваха до 700 оператори на индексиране. Поддържането на такъв постоянен персонал е неизгодно, така че големите и опитни компании често привличат местното население за големи регионални архивни проекти. За първи път тази технология беше използвана при дигитализацията на регистрите за раждане за проекта „Поколения Пермска територия". Няколкостотин души бяха наети временно чрез Центъра по заетостта. И те работеха у дома, чрез специално приложение.

Класически пример е датата 37 май е посочена в стар документ. Обучен и здравомислещ оператор, разбира се, не е въвел грешни данни, а е уточнил датата според съседните страници на регистрационния регистър на ражданията.

Основният въпрос е как да се постигне 100% качество? В крайна сметка в името, датите, числата не можете да правите грешки. На помощ идват твърда система и технологии. Например методът на двойно въвеждане, когато информацията влиза в базата данни само след едно и също въвеждане от 2 оператора.

Но проблемът с мъртвите езици и писмеността все още остава. При ретроконвертирането на такива документи на преден план излиза опитът от индексиране на лидери на групи, които често трябва да решават сложни нестандартни задачи.

Складова наличност

А сега за основното. Както беше отбелязано в началото на статията, обещаваща стратегия за дигитализация на архивните фондове е превръщането на пълен НСА в електронен вид. Това е най-много тежка работа. методически препоръкиРосархивът установи правилата за поддържане на бази данни по архивни описи. Следователно материалните запаси трябва да бъдат индексирани от широк набор от полета.

Сложността на дигитализирането на архивните описи се взема предвид, наред с други неща, в 44-FZ „На договорна система". Съгласно част 2 на чл. 56 от закона, „предоставянето на услуги, свързани с необходимостта от допускане на изпълнители, изпълнители до регистрационните бази данни на музеи, архиви, библиотеки“ е основание за провеждане на конкурс с ограничено участие (участието е ограничено до резултатите от предварително квалификационен подбор). Тоест само след като кандидатът потвърди своите компетенции и опит в изпълнението на подобни проекти.

Описите, както и документите, могат да бъдат порутени и написани на един от мъртвите езици. Запасите могат да имат много сложна структура и да съдържат . Форматът на инвентаризациите за обикновена и научно-техническа документация, както и обекти на нестоковото счетоводство се различава. Генерираната база данни трябва да бъде въведена в програмния пакет Архивен фонд и др.

Без задълбочено разбиране на процесите на архивна дейност, познаване на нормативната и методическата рамка, няма да е възможно да се извърши висококачествен превод на НСА в електронен вид. Затова е необходимо да се доверява дигитализацията само на доверени компании, които са доказали на практика способността си да се справят архивни фондове. И можете да оцените бюджета, като поръчате.

През последните години услугата за дигитализиране на документи стана много популярна за по-голямата част от компаниите. Почти всички съвременни организации са усвоили в една или друга степен информационните технологии и не могат да си представят работата си без използването на персонални компютри. Днес шаблоните за документи първо се създават на компютър и след това се разпечатват. но правна силапритежават документи с подписи и печати и те отново трябва да бъдат дигитализирани с помощта на цифровизация на документи.

За целта е необходима цифровизация на документите.

Често трябва да се позовавате на архивна документация, така че много компании предпочитат да имат електронни копия на всички хартиени документи на своята компания. Дигитализацията на хартиените документи може да улесни живота не само на мениджъри, счетоводители, икономисти и секретари, но и на представители на технически и творчески професии: дизайнери и модни дизайнери, строители и архитекти, инженери и дизайнери, както и много други професионалисти. Процесът на цифровизиране на архивни документи, съдържащи разнообразни диаграми, чертежи, формули, чертежи и снимки, е по-трудоемък и изисква участието на квалифицирани специалисти с богат опит в дигитализирането на документи.

На какво трябва да обърнете внимание при дигитализирането на документи:

професионално оборудване

Дигитализацията на сложни документи изисква професионално оборудване с голям брой технически възможности. След дигитализация специалистът проверява документите и електронното копие, компютърът разпознава текста на документа и коригира възможни грешки.

Възможна ръчна изработка

При дигитализирането на документи ръчният труд е незаменим, необходимо е, когато:

  • подготовка на документи за сканиране: премахване на кламери, файлове и други крепежни елементи;
  • ръчно сканиране на документи;
  • обратно опаковане на документи в папки;
  • при въвеждане на информация в системата;
  • проверка на въведената информация.

софтуер

Правилно подбраният софтуер ви позволява да опростите и ускорите решаването на задачи за цифровизиране на документи в пъти.

Опит и бързина

Фирма "Капитал Архивист" има дългогодишен опит в дигитализирането на хартиени документи и дава пълна гаранция. Че всичко ще бъде направено навреме и на най-добра цена.

Дигитализацията на документи е преобразуване на документи в цифров вид. Можете да дигитализирате рисунки, текстове и книги. Дейността на всеки средностатистически офис или институция рано или късно води до формирането в неговите стени голямо количестводокументи. Документите се съхраняват на рафтове и в чекмеджета на бюрото. Те заемат огромно количество място в офис шкафовете и на бюрата на служителите в офиса. Планини от документация, която е много трудна за разбиране и е почти невъзможно бързо да се намери един или друг документ. Така че офисът да не се превърне в архивно хранилище на документи, а служителите му могат бързо да работят с всякакви необходима документация, трябва да дигитализирате всички налични във фирмата документи и да ги прехвърлите от хартиен в електронен вид, като използвате услугите за сканиране и разпознаване на документи. Електронните документи са много по-лесни за обработка и съхранение. Те не заемат много място в офиса. Те не могат да бъдат загубени или повредени, а намирането на документ в дигитализиран електронен архив, където всичко е систематизирано и сортирано в пакети, е много по-лесно, отколкото в огромна купчина документи, съхранявани в офис шкаф. Дигитализираните документи са удобни и за използване в случай, когато служител на компанията отива в командировка или за преговори. Малко флаш устройство в джоба ви е в състояние да побере целия архив на документите на компанията и ще му даде възможност, ако е необходимо, бързо да намери всеки необходим документ. Много е удобно и практично да се използват дигитализирани документи, докато услугите за цифровизация на документи не са достатъчно скъпи и са достъпни не само за големи корпорации, но и за малки фирми и бюджетни организации.

Дигитализация на чертежи

Дигитализацията на чертежи, или както още се нарича векторизация, ви позволява да прехвърляте технически и архитектурни чертежи от хартиен в електронен формат. Услугите за цифровизиране на чертежи могат значително да опростят и систематизират системата за архивно съхранение на проектната документация и са много подходящи и за двете промишлени предприятияи научни институти, както и за архитектурни и проектантски бюра, частни архитекти, студенти и всички, които според спецификата на своята работа или обучение работят с чертежи. По правило основният проблем при архивирането на проектната документация е търсенето на желания чертеж, условията, при които трябва да се съхранява чертежът, отпечатан на хартия Whatman, и неговата обемност. Дигитализацията на чертежи може ефективно да реши тези проблеми. Когато даден чертеж се прехвърля от хартиен в електронен формат поради дигитализация, не е необходимо да има големи архивни площи за съхранението му, а е достатъчно само малко свободно място на твърдия диск на компютър или друг електронен носител. В същото време е достатъчно да систематизирате съдържанието на архива веднъж, като разложите дигитализираните чертежи в тематични папки и впоследствие е лесно да намерите всеки необходим чертеж. Чертежите, съхранявани в електронния архив, не са подложени на механично натоварване, или на влиянието на други природни сили и елементи. Те не могат да бъдат намокрени, скъсани или загубени, а благодарение на системата за архивиране, можете да се предпазите сто процента от тяхната загуба или загуба. Работата с дигитализирани чертежи е много по-лесна, отколкото с хартиените им копия. Много по-удобно е да носите със себе си лазерен диск, на който винаги имате достъп до целия архив, отколкото обеми от големи документи и неудобни рисунки. Да, и покажете чертежа на клиента, където е по-удобно на монитора на компютър или лаптоп, но без да разгъвате многометрова хартия за рисуване на масата му. Да не говорим, че дигитализираният чертеж може просто да бъде изпратен чрез електронна поща, като същевременно спестявате както вашето време, така и времето на този, за когото е предназначена тази рисунка. Днес много компании предоставят услуги за дигитализиране на чертежи и с удоволствие констатираме факта, че нашата компания е един от лидерите в областта на цифровизирането на документи. Към днешна дата разполагаме с цялото необходимо оборудване и програми, за да осигурим дигитализация на всеки чертеж с пълно детайлно запазване на качеството му.

Дигитализация на текстове

Дигитализацията на текстове е метод за преобразуване на печатен текст от хартиен в електронен формат. Дигитализацията на текстове е незаменима като удобен инструмент за създаване електронни архивии като инструмент за дигитализиране на книги и учебници. Сега любителите на литературното слово не трябва да седят с часове в библиотеките или да носят тежка и неудобна книга. Достатъчно е да имате електронен таблет, който лесно да се побере в джоба или чантата ви, и да четете всякаква художествена или справочна литература.

Дигитализация на книги

Дигитализацията на текста ви позволява да прехвърлите книга с всякакъв размер в цифров формат. Много е удобно и практично. В допълнение към лекотата на използване, заслужава да се спомене и очевидните икономически ползи. Далеч не винаги можете да закупите този или онзи учебник или книга за себе си и в същото време можете да го заемете от библиотеката или от приятел и благодарение на услугата за дигитализация да станете собственик на електронната версия, като харчите много по-малко пари за това, отколкото за закупуване на книга. Дигитализацията на книгите също така значително опрости процеса на съхраняване на редки ръкописи и книги с историческа стойност. В крайна сметка хартията не е вечна, но електронна версияПечатното слово наистина може да се съхранява в продължение на хиляди години и никога няма да загуби оригиналното си съдържание, запазвайки не само текста, но и илюстрациите за потомството.