Дигитализация на архивни документи Технически и технологични проблеми. Как да дигитализирате вашите документи

Дигитализирането на хартиените архиви включва сканиране и каталогизиране на документи. Колкото по-голяма е организацията, компанията, толкова по-сложен е нейният документооборот, толкова повече документи се съхраняват в нейните архиви и толкова по-привлекателни изглеждат услугите за дигитализация на архиви.

Търсене на спестявания

  1. Често за търсене в архива изискуем документотнема много време и усилия. Или може да възникне ситуация, когато един и същ документ се изисква от няколко служители наведнъж - в този случай трябва да направите копие от него.
  2. Освен това си струва да се отбележи, че честото позоваване на хартиени документи рано или късно води до тяхното увреждане, а понякога и до „загуба“, ако файловете са погрешно подредени в архива.
  3. Но е доста лесно да разрешите всички тези проблеми - просто трябва да осигурите дигитализация на хартиените архиви, да използвате автоматизирани информационни системи в работата си, които ще осигурят бързо търсене, както и достъп до електронни копия на документи.
  4. Ползите от дигитализирането на хартиените архиви са много. И ние говорим не само за качествено нови възможности за предоставяне и използване на фирмена документация, но и за гарантиране на безопасността на тази информация.

Ползи от дигитализираните документи:

  • намаляване на натоварването на хартиения архив и зоната за фотокопиране;
  • възможността за освобождаване на архивно пространство;
  • намаляване на разходите за поддържане на хартиени архиви.

Дигитализация на хартиени архиви: етапи

Първи етап.Цялото цифровизиране на архивите започва с преглед на документи. В резултат на анализа на документите се определя структурата на хартиения масив, както и количествени и качествени характеристикидокументи. Въз основа на резултатите от проверката се извършва изборът на технология и дигитализация на документи, критерии за оценка на качеството, изборът на състава на оборудването, съгласуват се сроковете и бюджетът.

Втора фазае самото сканиране. Дигитализирането на архиви е процесът на създаване на графични изображения на документ с помощта на скенери. Преди да преведете документ на електронен изглед, операторът ще избере оптималния режим на сканиране, ще проведе всъщност сканиране, като същевременно ще контролира качеството на получените изображения на монитора.

Ефектът от въвеждането на електронен архив

Дигитализацията на хартиените архиви води до електронни копия на документи. Професионалното оборудване, използвано от нашата компания, позволява сканиране различни документисъс скорост до няколко хиляди страници на ден - в пакетен режим. Получените файлове се записват на флаш памети, CD, DVD и други носители.

Архивни резултати от дигитализация

Веднага след приключване на дигитализирането на архивите графичните изображения се подлагат на автоматизирана обработка – разделяне на разперени страници, изрязване по краищата, подравняване по линии, премахване на шум, подобряване на качеството на изображенията и т.н. Можете да зададете параметрите за каталогизиране на сканирани документи по ваша преценка, като по този начин гарантирате оптимизирането на бизнес процесите от страна на управлението на документи.

В офиса често е необходимо да се изпрати чрез имейлкопия - електронни версии на печатни документи. Това могат да бъдат различни актове, фактури, писма, договори, устави, служебни бележкии всякакви други възможни документи.

Вкъщи имаме стари фотографии, които са се окаляли през годините и бихме искали да ги запазим.

За известно време ни подариха интересна книга, но искам да си я имам вкъщи. Как да направя всичко? Нашите краткотрайни хартиени документи трябва да бъдат преобразувани в електронен вид, тоест дигитализирани и запазени.

Дигитализацията е превод на изображение или аналогов аудио/видео сигнал в цифров формат, подходящ за запис в електронен носител.

За дигитализиране на изображения на обект има специални устройства - скенери. Има скенери за баркод, филмови скенери. Биометричните скенери разчитат модел на ретината или папиларен модел на кожата на пръстите на ръката. Формата на обемен обект се чете от триизмерен 3D скенер.

В скенери за обработка хартиени носители- чертежи, снимки, текстови документи, изображението се осветява ред по ред със специална лампа, а отразеният светлинен поток се фокусира върху фоточувствителна матрица. Аналогово-цифров преобразувател преобразува получените електрически сигнали в двоична система от данни, която образува цифрово копие на изображението.

Изборът на скенер зависи от задачите и спецификата на неговото приложение. Скенер в офиса почти винаги се използва за дигитализиране на документи. Дори снимките да са сканирани, в офиса към тях не се налагат високи изисквания за качество. Разделителната способност от 300 dpi е достатъчна, за да се осигури точна работа на програмите за разпознаване и да се получи добро четим текст... Всеки скенер, произведен днес, осигурява резолюция, която е приемлива за работа в офиса.

Това важи и за дълбочината на цвета. Почти всеки модерен скенер възпроизвежда нивото на сивото, необходимо за отпечатани документи.

Важно е в офиса, където основната задача е бързото дигитализиране на текстови документи по страница, е автоматизирането на процеса на сканиране. Могат да се използват листови скенери. Тук лист документ се вкарва в слота на машината и се изтегля, както при факс, по протежение на направляващите ролки. Такъв скенер е удобен с вградено автоматично устройство за подаване на листове. Зареждаме няколко листа от многостраничен документ в тавата и докато скенерът дигитализира, едновременно с това правим нещо друго. Тук всичко е просто. Ако е инсталиран съответният OCR софтуер, достатъчно е да натиснете един бутон, за да дигитализирате и запишете документа в желания формат на такъв скенер.

Модерно офис решение за отдел на проектна компания, например, може да бъде скенер за формат A3, включен в многофункционално устройство заедно с A3 / A4 принтер. Удобно е да се дигитализират и правят копия на чертежи на такова MFP.

Ясно е, че сканирането на подвързано списание или разпространението на книга на листов скенер няма да работи.

За сканиране на двустранни документи има дуплексни скенери, при които два сканиращи елемента обработват двете страни на листа с един проход.

Добро решение за дома е цветно мастиленоструйно MFP. MFP е многофункционално устройство, което включва скенер и принтер. Такова устройство е и копирна машина. Тоест, MFP може автоматично да сканира документ и да отпечата копие от него - да създаде фотокопие на документа.

Компактното устройство с комбинирани функции заема по-малко място на масата. Цената му ще бъде значително по-ниска от общата цена на включените в него устройства, ако ги закупите отделно. На цветен мастиленоструен принтер правим висококачествени цветни снимки и визитки, а с плосък скенер дигитализираме документи, фотоалбуми или необходими книги.

В следващите уроци ще научим как ръчно да дигитализираме, конвертираме и записваме на плосък скенер, страница по страница. текстови документи.

В тези примери използвах популярно настолен MFP формат A4 за сканиране. Такова евтино устройство е оптималното решение за дома и може да бъде второто, допълнително MFP в офиса.

Да предположим, че имаме многостранична логически свързан документ, който трябва да бъде дигитализиран и изпратен по пощата до нашия контрагент. Да го наречем "Договор".

В любимия ни Windows XP има стандартен „Съветник за работа със скенер или цифров фотоапарат“. За да работи съветникът, трябва да има инсталиран скенер на компютъра и да е включен. Съветникът е много лесен за използване и в урока има малък урок за цифровизиране на документи в Windows XP.

В Windows 7 стандартната функция за факс и сканиране на Windows е инструментът за създаване на електронни копия на отпечатани документи и изображения.

И така, ние прочетохме уроците и използвайки една от тези програми получихме сканирани файлове на страниците на нашия договор в една от графични формати, са запазили и моля, прикачете ги към имейла си, изпратете ги на адреса.

Лошото тук е, че при сканиране на многостраничен документ с тези програми няма да можем да комбинираме сканираните страници в един файл. Разбира се, можете да номерирате файловете на страниците в ред и да ги архивирате за компактно разпространение. Но нашият адресат ще може да разглежда страниците в графичен редактор само една по една, без да може да навигира в документа. Неудобно е и губи време. И като цяло е неприемливо.

Всъщност, използвайки тези инструменти, получаваме отделни цифрови снимки на страниците на документа.

За да преобразуваме нашите разпръснати сканирания в единичен документс възможност за търсене в пълен текст, имате нужда от програма за разпознаване на текст. Най-доброто за днес е FineReader.

FineReader е програма руска компания ABBYY. Последната версия 12 на ABBYY FineReader беше пусната през февруари 2014 г. Тази програма извлича текстови данни от цифрови изображения - разпознава текстови знаци. Оценителна версия на ABBYY FineReader 12 Professional може да бъде изтеглена от официалния ресурс: http://www.abbyy.ru/finereaderи тренирайте 30 дни.

По-добре е, когато една от най-новите професионални версии е инсталирана на компютъра. По-нататък се описва работата в ABBYY FineReader 10 Professional Edition.

И така, в предишните уроци сканирахме страниците със стандартни инструменти на Windows, номерирахме ги, записахме ги с разширението „jpg“ и ги поставихме в отделна папка, наречена „Споразумение“.

Така че, използвайки прекрасните възможности на програмата за разпознаване, можем лесно да конвертираме различни изображения в редактируеми формати.

За това, моля, в следващия урок: Сканиране в ABBYY FineReader.

И така, ние четем тези уроци и виждаме какви предимства ни дава програмата за разпознаване. Вместо досадно и отнемащо време да пишете от книга или брошура, ние просто сканираме необходимите страници на FineReader, редактираме ги, ако е необходимо, и ги запазваме в избрания формат. Така че можете бързо да въвеждате, например, статия или абстрактно.

А как да сканираме страниците на книгите и да дигитализираме книги, четем в темата: Дигитализиране на книга.

За да завършим темата, нека обобщим: скенер в комбинация с програма за разпознаване е рационален заместител на писането от клавиатурата. Имайки хартиен вариант - текст, отпечатан на принтер или в типография, ние просто го сканираме, вместо да въвеждаме от клавиатурата. Друга популярна област на приложение на скенера е дигитализацията на различни печатни продукти - етикети, пощенски картички, снимки, списания, книги.

Имате ли сериозни проблеми със съхраняването на хартиени документи? Рафтовете се пръскат от абсурдно раздути папки, а вие прекарвате три часа в търсене на подходящото парче хартия? Тогава е време да започнете да дигитализирате документи, което ще направи вашия офис или апартамент по-чист, а методът за търсене по-лесен и удобен. Създайте своя собствена цифрова библиотека, редактирайте, копирайте и премествайте цифрови файлове, както желаете. Възможността за създаване на цифрови документи е едно от предимствата на цивилизацията. Така че се възползвайте от него!

Преди да се осмелите да дигитализирате документите си, трябва да знаете, че има два начина да ги съхранявате – като изображения и като текстови файлове. Съхраняването на изображения ще изисква много повече място на твърдия диск, но все пак ще можете да запазите стила на оригиналния документ. Преобразуването на сканирани изображения в текстов файл ще изисква допълнителна инвестиция на време, тъй като е необходимо да се извърши процесът на оптично разпознаване на символи OCR (въпреки че, за да бъдем точни, това име не е съвсем правилно, тъй като тук говорим за работа с цифрова информация обаче, както често понякога терминът остава).

Как да изберем формат за съхранение на документи? Много е просто: ако оригиналният документ е ръкописен и за вас е важно да запазите неговата "специфичност" (писмо от любим човек) или ако документът е например произведение на изкуството, тогава го запазете като изображение (понякога разпознаваемият почерк е също толкова важен, колкото и написаните думи). Друга по-прозаична причина за запазване на ръкописни документи като изображения е липсата на достъпно в търговската мрежа софтуерно решение, подходящо за интерпретиране на ръкописни знаци. Засега тази технология е заседнала в PDA устройствата и таблетите, в които е внедрена в малко по-различна форма, отколкото ни е необходима. Когато работите с таблета си, пишете знаци на ръка, като ги въвеждате по ред и програмата ги преобразува в въведен текст в реално време. Разпознаването на почерка на един човек от сканиран документ е въпрос на бъдещето.

скенери

Независимо дали съхранявате вашите документи като изображения или като текстови файлове, имате нужда от скенер, за да ги дигитализирате. Ако искате да дигитализирате относително голям бройдокументи, тогава мултифункционален принтер или плосък скенер ще са ви достатъчни. Единственият им недостатък е относително ниската им скорост на работа. Имайте предвид, че само по-скъпите модели имат функция за автоматично подаване на листа за работа с документи с много страници.


Сред най-добрите модели са ScanSnap S1500 на Fujitsu и ScanJet Professional 3000 на HP. Тези устройства имат средна скорост на сканиране на документи от 20 страници в минута или повече. В същото време ScanJet Professional 3000 има по-надежден механизъм за подаване на хартия, докато ScanSnap S1500 има по-усъвършенстван софтуер. И двата скенера са в приблизително еднакъв ценови диапазон, така че зависи от вас.

OCR - софтуер

Повечето скенери идват с софтуерза извършване на OCR, който е инсталиран на вашия компютър. Ако не сте доволни от придружаващия софтуер или не, тогава такива програми са доста често срещани и могат да бъдат закупени отделно. Има следните пазарни предложения:

FineReader 9 Express от ABBYY, $100 за обикновената и $400 за професионалната версия на Pro 10;
... OmniPage 17 Standard от Nuance, $150 за обикновената версия на програмата и $500 за професионалната версия;
... Acrobat X Standard от Adobe, $299 за обикновен и $449 за професионален;
... Nuance PaperPort 12 Standard струва $100 за обикновената и $200 за професионалната версия на софтуера, въпреки че няма OCR функция, а само опцията за управление на сканирани документи.

Разрешение

За документи, съхранявани под формата на изображения, като правило е достатъчно да зададете разделителна способност от 150 до 200 dpi, но OCR софтуерът работи много по-добре, ако изображенията се записват с по-висока разделителна способност - 300 ppi. Всичко зависи от това, което ви трябва. Ако просто искате да запазите поне минимална четливост на вашия сканиран документ, можете да намалите изискванията за разделителна способност. Ако е важно за вас високо качество, след което го увеличете съответно.

OCR в мрежата

Има няколко онлайн услуги, които предоставят услуга за разпознаване на сканирани документи. Сред най-известните са безплатните ресурси Безплатно OCR , Ново OCRи OCR онлайн... Те са чудесни за малки проекти, тоест работят само с малки документи. Първо трябва да сканирате оригинала в паметта на компютъра и след това да качите изображението на документа на уебсайта. Естествено, всеки ресурс има свои собствени ограничения както по отношение на обема, така и по отношение на съдържанието на документа. Така уеб приложенията разпознават само текст, без редове или допълнителни знаци, които присъстват на страницата.

Обслужване Безплатно OCRе безплатно, но размерът на изтегляне не може да надвишава 2 MB и да съдържа не повече от 5000 пиксела, което е приблизително 50 dpi за стандартен документ. Освен това можете да обработвате не повече от 10 такива документа на час. Услуги на сайта Ново OCRможете да го използвате и безплатно, но интерфейсът му е изключително примитивен, но обемът на обработваните документи е 2,5 пъти повече - до 5 MB. И накрая, ресурсът OCR онлайнизисква безплатен акаунт, но ви позволява да качвате до 15 файла на час до 4 MB при резолюция от около 200 dpi на страница. Ако не сте доволни от такива обеми, можете да закупите платен достъп за $3,95 (8 цента на страница) и да можете да обработвате до 50 документа наведнъж или да платите $49,95 за обработка на до 5000 (1 цент на страница) ). Това уеб приложение работи както с текстови, така и с графични елементи, но, разбира се, е далеч от стандартите на Acrobat X или FineReader 10.

Електронни книги

Вероятно и вие, като мен, обичате миризмата на истинска книга, обичате усещането за дебела хартия и вида на красива графика. Днес обаче все повече хора предпочитат да се занимават с електронни книги, които се четат с помощта на така наречените специални електронни четци, таблети, смартфони, плейъри и други преносими устройства. Страхотно количествоонлайн магазините предлагат просто гигантски количества съдържание. Но какво ще стане, ако искате своя собствена колекция от електронни книги, които не са достъпни в цифров вид?

За да конвертирате любимите си „физически“ книги в електронни, първо трябва да ги сканирате и след това да ги преведете в текстов формат с помощта на програмата OCR. Това е досадно дори ако използвате много бърз ПЛОСКОВ скенер. Тези скенери приличат на "фотокопирни машини", имащи притискащо покритие, така че могат да сканират не само отделни листове, но и цели книги. Ако сте готови да изкормите любимата си книга, можете да използвате скенера SHEETFED, който работи като факс, тоест с отделни страници (като ScanSnap S1500 от Fujitsu и ScanJet Professional 3000 от HP).

След като преведете вашите документи, учебници или книги във формати PDF, Word или fb2, можете да използвате специални програмиза организиране, редактиране или четене електронни документи... Например Калибър или Станца. - безплатен органайзер и редактор за вашата колекция от електронни книги. Програмата помага за работа с каталога – организиране, класифициране, коментиране, търсене, запазване на нови и стари книги на твърдия диск на компютъра или в паметта на електронен четец.

Колкото по-голяма е организацията, за която говори компанията, колкото повече документи се съхраняват в нейния архив, толкова по-сложен е документооборотът й, толкова по-привлекателни изглеждат услугите за дигитализация на архиви. И така, това, което е дигитализация на архивите, е процесът на сканиране и каталогизиране на документи.

Неудобство при работа с хартиени архиви

Така че, в големи архиви за търсене необходимия документмного често трябва да отделите много време и енергия. Освен това най-често използваните документи с течение на времето могат да бъдат повредени или дори „загубени“, ако погрешно бъдат поставени в архива. Често във всякакъв вид бизнес възникват ситуации, когато се изисква висока ефективност при предоставяне на информация: понякога трябва бързо да подготвите документи за подписване, да направите хартиени или цифрови копия, внимателно да ги зашиете - когато работите с хартиени архиви, ефективността се губи. Това не е пълен списък на неудобствата, с които човек се сблъсква при работа с хартиени архиви. Но в същото време има доста прост и елегантен начин за решаване на проблема - дигитализацията на документи.

Ползите от дигитализирането на архиви?

  • заслужава да се отбележи намаляването на натоварването на хартиените архиви, както и на зоната за фотокопиране. Така че сега, ако няколко служители на организацията се нуждаят от един документ едновременно, изобщо не е необходимо да го фотокопирате.
  • дигитализацията на документи може значително да намали разходите за поддръжка хартиен архив, както и да освободите малко пространство, използвано преди за съхранение на хартиени архиви.

Как върви процесът по дигитализация на документи?

  • Специално обучени специалисти се занимават със сортиране на документи (на територията на вашата компания или ги доставят на територията на организация, която дигитализира архиви), след което с помощта на съвременни скенери дигитализират архивния фонд в пълен или отделен размер.
  • Баркодовете и отпечатаните документи се преобразуват автоматично в електронна форма от системата за оптично разпознаване на знаци. В същото време се запазват основните детайли на документите: име, дата, вид, контрагент и т.н.
  • За да се избегне възможно изкривяване при повторно въвеждане на данни за контакт, телефоните за дигитализиране на ръкописна информация при цифровизиране на архиви използват система за двойно въвеждане. Тоест, дигитализирането на документи в бъдеще ще ви даде възможност да извършите пълноценно оперативно търсене по ключови думи или търсене по определени видове документи / контрагенти.

Управление на файлове

Електронните архиви ви позволяват да управлявате сканирани файлове. След дигитализирането на архивите документите на хартиен носител подлежат на систематизиране и описание. Зашиват се, съставя се систематизиран пълен каталог от документи, съобразен с нуждите и спецификата на фирмата клиент. Това позволява в бъдеще значително да се спести време и усилия при работа с архиви.

Дигитализация на архивите

I.E. Хворова

Процесът на цифровизиране на документи за създаване на електронен архив

Статията е посветена на процеса на дигитализация - най-удобният механизъм за съхранение и използване на информация в съвременни условия. Авторът разглежда основните моменти от процеса на цифровизиране на архивните материали, включително анализ възможни начиниконвертиране на документи в електронен вид, категории документи за дигитализация, формати за съхранение на електронни документи и изследване на съвременните стандарти за цифровизация. Статията също анализира необходимите условияза създаване на виртуален архив на исторически личности или събития в съвременен контекст. Специално вниманиеавторът обръща внимание на особеностите на организирането на електронен ресурс, разглежда съществуващите съвременни проекти по тази тема и анализира възможните трудности, пред които може да се сблъска изследователят при създаването на електронен архив.

Ключови думи: дигитализация, архивен документ, електронен фондизползване, виртуален архив.

Реалности модерен животвсе повече изискват от нас активното използване на нови информационни технологии. Информационната ера също прави свои корекции в света на диалога между архивните източници и изследователя. Съвременните цифрови технологии дават възможност за реализиране на най-глобалните идеи за създаване на алтернативно поле за съхранение - съхраняване на документи във виртуална равнина.

Дигитализацията на архивните документи е най-удобният инструмент за съхраняване и използване на информация. Той позволява по-безопасно и по-икономично съхранение, лесно търсене и използване.

© Khvorova I.E., 2017

информация, както и за бърз достъп до архивни материали. Процесът на цифровизиране на документи се основава на идеята за формиране на единен електронен фонд за ползване (наричан по-долу EPF). EPF е колекция от електронни копия на архивни документи, които са записани на цифров носител и са предназначени да се използват вместо оригинални документи1. Важен момент при създаването на ESP е необходимостта от регулиране на процеса на неговото създаване.

Според заместник-ръководителя на Федералната архивна агенция O.V. Наумов, основните цели на дигитализирането на документи са разширяване и опростяване на достъпа до документи от архивния фонд, осигуряване на безопасността на оригиналите чрез постепенното им изтегляне от употреба, осигуряване на достъп до електронния фонд, както и ускоряване на процеса на предоставяне услуги2.

Нека разгледаме основните моменти на процеса на дигитализация. На първо място трябва да се има предвид, че архивният фонд Руска федерациясъхранява обширен документален масив. По този начин, преди да започнете да сканирате самите документи, е препоръчително да ги дигитализирате научна и справочна апаратураархивиране, създаване на електронни описи за извличане на данни. Първоначалното цифровизиране на архивните описи позволява на потребителя да се запознае със списъка на съхраняваните документи, без да напуска дома си и да поръча документи, които представляват интерес в Интернет. В този случай е необходимо да се вземе предвид и фактът на научно-техническото издание на заглавията на делата - само ако инвентаризацията се подобри, е възможно да се започне дигитализирането на фонда.

Категориите документи за дигитализация включват не само документи, за които съществува заплаха от загуба на информация, но и най-ценните, уникални материали и търсени документи. Критериите за документите за уникалност и стойност на документите са малко неясни и търсенето не е постоянно, следователно при избора на материали за дигитализация често възниква въпросът: кои документи трябва да бъдат дигитализирани на първо място? Може да е по-лесно да се постигне по-добро вземане на проби, ако процесът на подбор включва повече от членове. експертна комисияархив, но и ангажирани професионалисти – историци, политолози, социолози, общественици и пр. Процесът на създаване на такава работна група изисква ясна регламентация. Трябва да се отбележи, че въпреки формулираните критерии за подбор3, те не са задължителни и регионални архиви

има право да избира документите, които трябва да бъдат дигитализирани на първо място.

Изборът на метода на дигитализация е важен, тъй като носителят и форматът на представяне на материала също носят информация, полезна за работата на изследователя, следователно е много важно тя да бъде предадена в най-точната форма, съпоставима с оригинала.

При директното цифровизиране на документи е важно да се спазват всички мерки за безопасност при работа с оригинала, трябва да се обърне специално внимание при сканиране на книги и древни актове (светлина, принтер, поведението на специалист по време на дигитализация трябва да отговаря на приетите стандарти ). На този етап финансовите възможности на проекта за дигитализация играят ключова роля - изборът на оборудване за сканиране определя степента на сигурност на този процес за оригинала. Изборът на по-икономично хардуерно устройство неизбежно води до риск от непоправими щети на документите и също така намалява шансовете за създаване на сравнимо пълноцветно заместващо копие4.

При дигитализирането на документ се изработват най-малко две копия от оригинала - работно копие и основно копие. И двата материала трябва да бъдат маркирани и регистрирани в специален регистър. Благодарение на такава система за регистрация търсенето на сканирания документ ще бъде по-бързо и по-удобно за потребителя, а идентификационните данни ще улеснят проследяването на документа като цяло. информационна системаархив.

Сред форматите за съхранение на изображения най-разпространени сред архивистите са форматите TIFF и JPEG. Форматът TIFF дължи своята популярност на способността си да запазва качеството на изображението благодарение на алгоритмите за компресиране на данни без загуби. JPEG форматът е силно компресиран, но влошава качеството на изображението. Промените може да не се виждат с просто око, но компресираното изображение ще показва резки контрасти или пиксели. Следователно JPEG не може да се използва като междинен формат за обработка на изображения. Само окончателната версия може да бъде запазена в JPEG. Що се отнася до другите видове електронни документи и най-предпочитаните формати за съхранението им, има текстови документи (ms-word, txt, pdf, html, xml, rtf), видео (mov, avi, mpeg, mp4) и аудио (wav , aiff, mp3), чертежи (autocad), графики и диаграми (tiff, pcx), бази данни под формата на електронни таблици и релационни бази данни (xls, xml, html, mdb). За фотографски документи също е приемлив pdf формат. Полученият масив от данни може да се използва за предаване по цифрови канали,

съхранени на цифрови оптични носители (еднократно записващи CD-R, DVD-R, презаписвани CD-RW, DVD-RW, DVD-RAW дискове), магнитни (твърди дискове, флопи дискове, магнитни ленти), флаш памети и др. д.

Изискванията за качеството на получените цифрови копия не са ясно формулирани. Няма критерии за оценка на качеството на електронните копия на хартиените документи: параметри на изображението, възпроизвеждане на тона (контраст), яркост, шум, точност на цветовете, острота, разделителна способност, геометрични изкривявания и др. биха били полезни за Русия. Националният стандарт на САЩ ANSI / AIIM MS44 „Насоки за контрол на качеството на скенери за изображения“ установява и разкрива основна терминология, основни параметри и критерии за оценка на качеството на сканиране, както и подходи за тяхното практическо измерване. На негова основа, като се вземат предвид съвременните изисквания през 2000 г., бяха разработени международни стандарти ISO за оценка на качеството на сканиране на черно-бели документи.

След дигитализация оригиналът се връща на съхранение в архива, а направените копия добавят към електронния фонд на потребителя и стават достъпни за изследователите.

Търсенето на решение на проблема със съхранението и оперативното използване на архивни документи започва в средата на 90-те години, когато Конгресната библиотека на САЩ започва тотална дигитализация на съществуващата колекция от микрофилми (като самостоятелна колекция и като основен носител на застраховки и средства на потребителите). В процеса на дигитализация американските специалисти се сблъскаха с необходимостта от разработване на единни подходи за осъществяване на процесите на прехвърляне на информация от материални носители в електронна форма, тоест имаше нужда от регулиране на процесите на цифровизация.

Според нивото на тяхното регулиране съвременните стандарти за цифровизация могат да се разделят на 3 категории стандарти: международен, национален и организационен стандарт. Международният стандарт ISO5 се разработва от група учени, използването му осигурява технологични, икономически и социални ползи, но не е задължително за никоя страна, участваща в организацията ISO. Националният стандарт е задължителен за използване от властите държавна властразлични нива, той се разработва за подобряване на процедурата по дигитализация, като се вземат предвид спецификите на законодателството, стандартите за документи

отношения в определена държава. Стандартът на организацията подчертава спецификата на конкретна компания в процеса на превод на документ в електронен вид и последващото му съхранение и използване. Най-известният национален стандартрегулиращ процеса на цифровизация е „S6: Стандарт за цифровизация“ 6, въведен в действие от Националния комитет по стандартизация на Австралия и Нова Зеландия през 2006 г.7 За съжаление, Русия няма подобен документ, регулиращ процесите на цифровизация и създаването на ESP. ..

През 2012 г. служители на Всеруския научно-изследователски институт по документация и архивно дело (VNIIDAD) и Федералната архивна агенция (Росархив) разработиха „ Насокипо електронно копиране на архивни документи и управление на получения информационен масив”. Моделите за тези насоки са стандартът за цифровизация S6 на FADGI и Техническите указания. За продължаване на работата в тази насока изглежда целесъобразно разработването на Стратегия за разработване и актуализиране на отраслови нормативни и методически актове, регламентиращи различни области на дейност в областта на информатизацията на архивното дело, както и създаване на нормативни актове и дългосрочен планза неговото изпълнение. Разработчиците са разпределили ключови точкитова трябва да се има предвид при изготвянето на регулаторен документ.

1. Структурата и съдържанието на разработените и внедрени документи на международни и национални системи за стандартизация се дължат на спецификата правна рамкастраната, откъдето произхождат. Следователно техният директен превод и използване в Руската федерация изисква балансиран подход.

2. Необходимо е да се създадат повече от един регулаторен документрегламентиращи въпросите на цифровизацията, но набор от нормативни правни актове, описващи изискванията за всички етапи и аспекти на този процес.

3. Структурата и общото съдържание на тази нормативна и методическа документация могат да бъдат изградени върху чуждестранни аналози, избрани от експерти от индустрията като примери, които са най-близки и адекватни на руските условия. В същото време вътрешните разработки трябва напълно да отразяват спецификата на всички процеси и аспекти на цифровизацията (включително изискванията за оборудване, персонал, процедури и управление на качеството), присъщи на Русия8.

Дигитализацията на документите е необходима мярка за организиране на бърз достъп до архивни документи. Наличността определено е

Този масив от документи ви позволява да създадете нов, лесен за използване, научно полезен информационен ресурс - виртуален архив. Примери за такива виртуални хранилища могат да се видят на уебсайта на Руския държавен архив на литературата и изкуството.

Виртуалният архив на I.A. Бунин е ресурс с удобна класификация на подадените документи и удобен за потребителя интерфейс. Документите са разделени в три групи: „Ръкописи“, „Изрезки от вестници и списания“, „Изящни материали“ и представляват сканирани копия на оригиналите от фондовете на Руския държавен архив на литературата и изкуството и Архива на руската диаспора. в Лийдс9. Разработчиците на проекта определят ключовите моменти за реализирането на такива проекти: финансови въпроси, проблемът с фрагментирането на архивните документи и необходимостта от преговори с хранилища на различни институции и дори държави за събиране на необходимия материал и накрая решаване на правни въпроси - тъй като важи и електронното публикуване на материали Авторско право... Ресурсът представлява положителен пример за реализация на проект за създаване на виртуален архив. Сайтът на Руския държавен архив за литература и изкуство също предлага да се запознаете с такива отлични примери за електронни хранилища, като например ресурс, посветен на документи Отечествена война 1812 г. и Първата световна война.

Създателите на електронното хранилище, наречено Reunited Virtual Archive на Osip Mandelstam, са Оксфордският университет и Mandelstam Society. Разработчиците на проекта имаха за цел да идентифицират, опишат и пуснат в Интернет всички или възможно най-голям брой запазени творчески и биографични материали на Осип Манделщам, независимо от тяхното физическо местоположение10. В същото време проектът съчетава ръкописи, преписи на текстове, както и коментари към тях.

Търсенето на документи е най-важният етап при създаването на подобни проекти. Този процес се усложнява от факта, че някои от по-рано познатите и въведени колекции може вече да не съществуват. Веднъж пуснати в продажба през 90-те години на миналия век, те сменят собствениците, дори имената на които не винаги е възможно да се установят. В други случаи собствениците не могат да намерят определени автографи или документи. Това се обяснява напълно с факта, че придобиването на архивни ръкописни фондове с документи

лидери на руската диаспора се осъществява основно чрез дарения и не е системно11. Разработчиците отбелязват, че същото се случва и с правителствените архиви. Така в Националния архив на Франция в продължение на няколко години не можеха да намерят документите за зрелост на О.Е. Манделщам (те бяха преоткрити през април 2008 г.) 12.

Важно е да се отбележи, че виртуалният архив на O.E. Mandelstam е не само успешен пример за реализация на подобен проект, но също така, благодарение на подробно описание на процеса на създаване на такъв архив на уебсайта, е един вид урокза наследници и изследователи на процеса на дигитализация.

Анализът на реализираните руски проекти за създаване на виртуални хранилища на исторически материали подчертава проблема с фрагментирането на документи и сложността на тяхното търсене. Затова при изготвянето на проект е важно да се съсредоточи върху евентуално сътрудничество с чуждестранни архиви.

По този начин нараства ролята на съвместната работа, съвместни проекти за създаване на единно виртуално поле за съхранение на материали от една и съща тема.

При дигитализацията е необходимо да се обърне внимание на процеса на вземане на проби от документи за преобразуването им в цифров вид, както и на избора на висококачествено оборудване за сканиране, за да се осигури безопасен за оригиналите процес на дигитализация. В момента обаче един от най-сериозните въпроси в тази област остава необходимостта от регулиране на процеса на цифровизация (вкл. Подробно описаниепроцеса на вземане на проби от материали и консолидиране на терминологичната база). Процесът на създаване на виртуален архив остава трудоемък и недостижим за повечето изследователи без подходящ стандарт, одобрен със закон.

Бележки (редактиране)

Методически препоръки за електронно копиране на архивни документи и управление на получения информационен масив. [Електронен ресурс] URL: http://archives.ru/documents/rekomend_el-copy-archival-documents/razdel-2.shtml (дата на достъп: 13.05.2016 г.). Характеристики на дигитализирането на документи в съвременни архиви... [Електронен ресурс] URL: https://www.pcweek.ru/ecm/article/detail.php7ID-154329 (дата на достъп: 13.05.2016 г.).

Юмашева Ю.Ю. Архивите и „надпреварата в цифровото въоръжаване” // Историческа информатика. 2013. No 3. С. 93.

ISO е Международната организация за стандартизация. Разработчик и издател международни стандарти... [Електронен ресурс] URL: http: //www.iso. org / iso / ru / (дата на достъп: 13.05.2016 г.).

Доклад за изследователска работа по тема 2.2.4 „Разработване на проект на индустриален стандарт за създаване на електронни копия на архивни документи“, Планът за научноизследователска и развойна работа, извършен въз основа на държавна поръчка на Федералната архивна агенция за 2014 г. 89 от 26.12.2013 г. (първи етап) „Проучване и анализ на чуждестранна нормативна и методическа документация, регламентираща цифровизацията на архивни документи“ / Ю. Ю. Юмашев. М.: ВНИИДАД, 2012. С. 84-163. На същото място. стр. 20.

Обединен електронен архив на Иван Бунин. [Електронен ресурс] URL: http://www.bunin-rgali.ru/ (дата на достъп: 13.05.2016 г.). Обединеният виртуален архив на Осип Манделщам. [Електронен ресурс] URL: http://mandelstam-world.info/intro.php (дата на достъп: 13.05.2016).

Попов А.В. Руската емиграция и архиви: Документи на руската емиграция в архивите на Москва: проблеми на идентификацията, придобиването, описанието и използването (Материали за история на руската политическа емиграция. Брой 4). М.: РГГУ, 1998. С. 150-151.

Обединеният виртуален архив на Осип Манделщам.