Прехвърляне в цифров формат на архивни документи. Архивно сканиране: как се дигитализират архивните документи

Дигитализация хартиени архививключва сканиране и каталогизиране на документи. Колкото по-голяма е организацията, компанията, толкова по-сложен е нейният документооборот, толкова повече документи се съхраняват в нейните архиви и съответно услугите за цифровизиране на архиви изглеждат по-привлекателни.

Спестявания при търсене

  1. Често за архивиране изискуем документотнема много време и усилия. Или може да възникне ситуация, когато един и същ документ се изисква от няколко служители наведнъж - в този случай трябва да направите копие от него.
  2. Освен това си струва да се отбележи, че честият достъп до хартиени документи рано или късно води до тяхното увреждане, а понякога и до „загуба“, ако файловете са погрешно поставени в архива.
  3. Но решаването на всички тези проблеми е съвсем просто - просто трябва да осигурите дигитализация на хартиените архиви, да използвате автоматизирани информационни системи в работата си, които ще осигурят бързо търсене, както и достъп до електронни копия на документи.
  4. Дигитализацията на хартиените архиви има много предимства. И ние говорим не само за качествено нови възможности за предоставяне и използване на фирмена документация, но и за гарантиране на безопасността на тази информация.

Предимства на дигитализираните документи:

  • намаляване на натоварването на хартиения архив и зоната за фотокопиране;
  • възможността за освобождаване на архивно пространство;
  • намаляване на разходите за поддържане на хартиени архиви.

Дигитализация на хартиени архиви: етапи

Първи етап.Цялата работа по дигитализацията на архивите започва с преглед на документите. В резултат на анализа на документите се определя структурата на хартиения масив, както и количествени и качествени характеристикидокументи. Въз основа на резултатите от проверката се извършва изборът на технология и дигитализация на документите, критериите за оценка на качеството, изборът на състав на оборудването, договарят се сроковете за изпълнение и бюджетът.

Втора фазае директно сканиране. Дигитализацията на архивите е процесът на създаване на графични изображения на документ с помощта на скенери. Преди да преобразува документа в електронна форма, операторът ще избере оптималния режим на сканиране, ще извърши всъщност сканиране, като същевременно контролира качеството на получените изображения на монитора.

Ефектът от въвеждането на електронен архив

Резултатът от дигитализацията на хартиените архиви са електронни копия на документи. Професионалното оборудване, което нашата компания използва, ви позволява да сканирате различни документисъс скорост до няколко хиляди страници на ден - в пакетен режим. Получените файлове се записват на флаш памети, CD, DVD и други носители.

Архивни резултати от дигитализация

Веднага след приключване на дигитализирането на архивите, графичните изображения се подлагат на автоматизирана обработка – разделяне на страници със спреди, изрязване по ръбовете, подравняване по линии, премахване на шум, подобряване на качеството на изображението и т.н. Можете да зададете параметрите за каталогизиране на сканирани документи по ваша преценка, като по този начин гарантирате оптимизирането на бизнес процесите от страна на управлението на документи.

В момента все повече внимание се обръща на проблемите на културна ценност. В тази връзка се одобрява правителствени програми, в рамките на които, според намерението на техните създатели, използването на нови технологии, иновативни подходи, както и световния опит ще гарантират безопасността културно наследство, исторически значими документи. Ето защо днес архивите на Русия преобразуват хартиените документи в електронна форма. За това какво беше началото на тази мащабна работа, с какви трудности се сблъскват архивистите и как решават проблемите със запазването на дигитализирани документи, заместник-ръководител на Федералната архивна агенция (Росархив) Олег Наумовказа пред кореспондент на PC Week/RE Олга Звонарева.

PC Week: Моля, кажете ни как започна процесът на дигитализация на архивни документи, какви са характеристиките на тази работа?

Олег Наумов:Задачата за масово преобразуване на архивни документи в електронен вид беше поставена в програмата Информационно общество (2011-2020). Това никак не е лесна задача. Освен това едно е да се дигитализират документи, а друго е да се дигитализират научна справочна апаратура(NSA), без който не може да се намери изискуем документ. Ето защо, когато преди две години възможността за нормално финансиране на работа в рамките на федералната целева програма„Културата на Русия 2012-2018“, на първо място, те започнаха да създават в в електронен формат NSA, което ви позволява ефективно да търсите документи.

PC седмица: Какво софтуеризползван за това?

ТОЙ.:Много преди приемането на програмата „Информационно общество“ Федералните архиви започнаха разработването на общоруския стандартизиран софтуер за организиране на счетоводство на документи - софтуерния пакет „Архивен фонд“. собствена система Руска федерация, въведен на ниво федерални, регионални и общински архиви. С неговото използване беше създаден централен каталог на запасите, хостван на портала Архиви на Русия. Първоначално Архивният фонд е създаден като счетоводен апарат, но след това започва да се използва като апарат за търсене. Сега редица архиви използват специализирани търсачки.

PC Week: Какъв архивен опит беше основен при дигитализацията на инвентарите?

ТОЙ.:Руският държавен исторически архив в Санкт Петербург пръв дигитализира всички инвентаризации, единствено поради обстоятелствата. Когато възникна въпросът за преместването му, описите бяха сканирани, а електронните им изображения бяха използвани на всички етапи от преместването, тоест всяка кутия, всеки случай беше проследен.

Беше добър опит, но от гледна точка на развитието на информационните технологии не беше много успешен. Въпреки че стана възможно запознаването с тях в читалнята и онлайн, колекцията от графични изображения не позволява автоматизирано търсене. Където по-голямо удобство се предоставя на потребителите чрез инвентаризации, преведени във формат на база данни, с възможност за лесно и разширено търсене. Росархив започна активно да финансира тези произведения. Към днешна дата са направени около 20-30% от описите на федералните архиви.

PC Week: С какви предизвикателства се сблъскват архивите при дигитализирането на документи?

ТОЙ.Първият проблем е големият обем. Общ обем Архивен фондРуската федерация има 494 милиона файла, от които 9% са във федералните архиви.

Но най-трудното е да се определи кои документи трябва да бъдат дигитализирани. Най-простият отговор е най-търсеният. И как да определим това търсене? Днес имаме нужда от едно, утре от друго. И в съветско времевъведено е понятието за особено ценни архивни фондове и документи. Създават застрахователен фонд на микрофилм, както и фонд за ползване. Днес обаче тези документи практически не се търсят. Тоест критериите за стойността и търсенето на документи от съветската епоха сега изобщо не работят. Търсенето непрекъснато се променя. Почти невъзможно е да се определи със сигурност кои документи ще бъдат най-търсени.

Техническата страна на въпроса също е важна. Например, имаше огромно търсене за съставяне на собствени родословия. Това е добре и необходимо. Те започнаха активно да поръчват тези дела: енорийски регистри, ревизионни приказки. Но те абсолютно не са пригодени за такава масова употреба. Сканирането им като най-популярни е глупост. От книга с дебелина 80 см на човек му трябва само една страница. И за да посрещнете това търсене, трябва да сканирате цели хиляда страници. Да, дори и с оборот. Но, от друга страна, ако тези документи се сканират, тогава оригиналите се изваждат от обращение и тяхната физическа безопасност е гарантирана. Всички те са уникални. И най-важното е, че злощастните пазители (включително много жени) няма да носят всички тези тонове документи на ръце.

Тук обаче попадаме във формата на предоставяне на информация. В крайна сметка за потребителя беше много по-интересно да получи не изображение, а декриптиране и база данни. И масивът от тези документи е огромен. Само в RGADA във фонда 350 "Ландратски книги и ревизионни книги" - повече от пет хиляди дела, около 3 милиона стр. Колко души трябва да бъдат включени? В Перм те намериха добър изход: привлякоха финанси, които бяха отпуснати за осигуряване на работни места. Работата е извършена от хора вкъщи. Успешно решен проблемът с безработицата. И в крайна сметка успяха да направят това, което никой друг в Русия, по моя памет, не можеше да направи.

Опитът от сканиране във федералните архиви ни позволява да направим два извода. Първо, създаването на електронен фонд за използване без създаване на NSA е непродуктивно занимание. Оказва се огромна купчина сканирания, където е невъзможно да се намери правилният. Второ, сканирането, особено масовото сканиране, е целесъобразно за разкриване на завършени комплекси – фондове или инвентари. В същото време делата трябва да се сканират изцяло, за да се избегнат конфликти при грешки в номерацията. V отделни случаи, поради уникалността и значимостта на документите, независимо дали има текст на гърба на листа или не, е необходимо да се дигитализира листа, включително и на гърба. Тогава въпросът, че може да сме скрили нещо, изчезва.

Има проблем с избора на оборудване. Някъде се нуждаете от обикновен скенер, някъде трябва да е по-сложен. Например, за дигитализацията на книгите на Landrat беше специално поръчана „дълбока люлка“. В противен случай не копирайте, защото дебелината на гръбнака на някои книги достига 80 см.

PC Week: Каква е основната цел на дигитализацията в момента?

ТОЙ.Има три от тях. Първият е разширяването и опростяването на достъпа до документите на Архивния фонд. Втората е да се гарантира безопасността на оригиналите чрез изтеглянето им от обращение и предоставянето на достъп до електронния фонд за ползване. Третото е опростяването на предоставянето на обществени услуги. Сега има много индивидуални искания от граждани за документи за персонал. Архивите също започват да ги дигитализират и използват електронни копия за подготовка на отговори, което значително ускорява работата.

PC Week: Как архивите дигитализират документи?

ТОЙ.Процесът протича по различен начин: някъде те го правят сами, използвайки импровизирани средства или придобивайки различно оборудване. Вторият начин е да се включат външни организации. Но все още няма еднозначен отговор на най-важния въпрос: към какво се стремим с дигитализирането на документи?

PC Week: И никой не ги пита?

ТОЙ.Защо, всеки пита. Но как да намерите единствения правилен отговор? Разбира се, предимството на използването на дигитализирани документи е очевидно. Това и сигурност, и отдалечен достъп, и лекотата на предоставяне на информация, и лекотата на правене на копия - пълен набор от плюсове. Друго нещо е как да се постигне това? Тук вие сте потребител, влязохте в сайта и определихте, че документите, от които се нуждаете, са на склад. Да речем в Перм. Отидохме до сайта чрез връзката, намерихме описания на случаи. Има един интересен въпрос. И как да го получите? Е, ако вече е дигитализиран. И ако не? Отидете сами в архива и поръчайте оригиналите? Или архивът трябва да дигитализира всички дела? Но това е нереално. Така че всъщност остава само една опция. Създаване във всеки архив на възможност за бързо производство на електронни копия по искане на потребителя. И не е задължително да е ваша собствена единица. Може да бъде и аутсорсинг. Но такава услуга трябва да бъде предоставена своевременно. Но да се правят тези копия, както показва опитът, има смисъл само когато вече има електронна система, което ще позволи качествено и структурирано поставяне на тези материали. Тогава ще проработи. Кога ще го направим и дали ще успеем да го направим, честно казано, не знам.

PC Week: Вероятно още преди одобрението на програмата за информационно общество през 2010 г. вече е била извършена работа по дигитализацията?

ТОЙ.да. Имаше отделни проекти. Например Електронният архив на Коминтерна или сборник от документи от СВАГ. По правило те се изпълняват съвместно с чуждестранни партньори. Собствените средства за тяхното изпълнение не бяха достатъчни. Въпросът не беше лесен. Имаше технически, методически, организационни и технологични затруднения. Но опитът се натрупва. И сега е много полезно.

PC Week: Тоест, след одобрението на програмата, те започнаха да определят какви трябва да бъдат основните критерии за цифровизиране на документи?

ТОЙ.Тази програма, да речем, позволи на архивистите да насочат вниманието на властите към факта, че има проблем и той трябва да бъде решен. Подготвя и одобрява програми за дигитализация. И да привлечете финансиране за това. Но днес няма универсален критерий. Трудно е да се определи единен подход за всички, тъй като архивите съхраняват напълно различна документация.

PC Week: Значи всеки архив всъщност сам определя критериите?

ТОЙ.Всъщност да. По принцип това са четири критерия, общоприети са, но няма да кажа, че са най-правилните. Това е търсенето на документи, осигуряване на безопасност, улесняване на работата на служителите в архива, подобряване на условията за обслужване на потребителите. Освен това ускорява работата. Ако имам електронен NSA на моя сайт, тогава потребителят идва в архива, подготвен чрез разглеждане на инвентара в Интернет. Ако необходимите документи вече са дигитализирани, той има възможност да ги разгледа на компютъра си, без да отива в архива, или да ги получи в читалнята без забавяне.

PC Week: Оказва се, че всеки архив трябва сам да реши какво да дигитализира на първо място?

ТОЙ.Съвсем правилно. Това трябва да бъде изключително индивидуална програма за всеки архив. Не можете да направите такъв. Зависи от много фактори: от финансовите възможности, от степента на развитие и внедряване на ИТ технологиите, от конкретното търсене. Така че някой е в голямо търсене на документи за персонал и е необходимо да се задоволят нуждите на гражданите. Макар и от архивна гледна точка, тези документи не са постоянни, а имат временен срок на съхранение от 75 години. Но това улеснява работата и помага на хората, защото човек не чака един месец отговор на заявка, а получава необходимата информация за два дни. Така че е необходимо да се инвестира в тези усилия и ресурси.

PC Week: Когато се определят приоритетите на документите, които ще бъдат дигитализирани, архивите съгласуват ли ги с руските архиви?

ТОЙ.Ако говорим за регионални архиви, тогава не. Това е работа на всеки архив. Изпращат ни програмите си за информатизация и дигитализация. Ние ги опознаваме и даваме нашите съвети. Помагаме им по силите си, отпускаме средства от FTP. Друго нещо са федералните архиви. Тук позицията на Руския архив е от решаващо значение. Но дори и тук няма универсален критерий. За да отговори на постоянно нарастващото търсене на генеалогична информация, Руският архив е отпуснал повече от 40 милиона рубли. за прехвърляне на ландрат книги, съхранявани в РГАДА в електронен вид. В отговор на постоянния интерес на обществото към историята на нашето отечество в близкото минало, през юни тази година стартира сайтът „Документи от съветската епоха“, където изображения на документи от личния фонд на IV Сталин и Политбюро на централният комитет са изпратени. Бяха подготвени интернет проекти, посветени на 1150-годишнината руската държавност, 400 годишнина от края на смутите, 200 годишнина Отечествена война 1812 г. Естествено там бяха публикувани изображения на най-важните и популярни документи.

PC Week: Значи сега в читалнята на архива ще се издават само електронни копия, а не оригинални документи?

ТОЙ.В идеалния случай имате нужда от човек, който да намери документа, който търси в сайта, да поръча случай и ще му бъдат предоставени сканирани документи. И оригиналът остава непокътнат. Има обаче случаи, когато трябва да видите оригинала. Например, колкото и добра да е техниката, тя няма да предаде водни знаци. И върху тях можете да зададете датата на документа. Но такива случаи са един на хиляда.

PC Week: Оказва се, че архивът е предоставен на потребителя обществена услуга, но след като дигитализираното копие на документа трябва да бъде запазено?

ТОЙ.Разбира се, това е предимството на сканирането. Преди имаше микрофилми, ксерокс, машинопис. И архивистът, като направи копия, ги даде на потребителя. Тоест не е имал копие от документа. В случай на дигитализация остава копие. Но за него мястото на съхранение трябва да бъде ясно определено. И ако има второ искане по-късно, няма да има нужда от повдигане на делото. Трябва да натрупате опит в този вид работа.

PC Week: Как се определят сроковете за дигитализиране на масиви от документи?

ТОЙ.Сроковете зависят от три причини: от технически и финансови възможности и от състоянието на документите. Има документи, които са подвързани по такъв начин, че дори най-модерната технология не може да получи напълно текста. Тоест ще трябва да бъдат бродирани, което не харесва нито документите, нито архивистите. Сканиране. След това шийте обратно. Отнема време. Също така сроковете зависят от обема на делата, от броя на листовете в тях. Не е толкова трудно да сканирате купчина документи в стандартен формат, но карта 3x8 m вече е по-трудна. По счетоводни документи това е един лист. Но се сканира само на части. И след това в софтуера трябва да го „зашийте“ всичко, да го коригирате и да видите как ще изглежда този документ.

PC Week: Как върви работата по изпълнението на 89-та точка от федералната целева програма „Култура на Русия (2012-2018): формиране на архивни електронни ресурси и тяхното предоставяне в Интернет“?

ТОЙ.Като част от изпълнението на тази позиция инвентаризацията се дигитализира. Документите също се дигитализират, включително ландрат книги. Освен това се опитваме да помогнем и на регионите: включваме около пет-шест региона годишно в тази програма и отделяме от 10 до 15 милиона рубли. Създаваме онлайн изложби и др. Общо 67 милиона рубли се отделят годишно за изпълнение на работата по тази програма.

PC Week: Разпределението на средствата зависи ли от степента на важност и значимост на документите?

ТОЙ.да. Архивите подават заявки в определена форма за участие, ние разглеждаме тези заявки. Също така се прилагат фирми, които вярват, че предлагат интересни неща. Ние ги разглеждаме, избираме интересни обещаващи решения, съставяме общ план и извършваме покупки на конкурентна основа. Миналата година имаше 52 държавни поръчки за това събитие. Тоест всяка седмица подписвахме договор.

PC Week: Засегнахте темата за документите, които вече се съхраняват в архивите, започвайки от 11 век, но нови документи на хартиен носител също идват в архивите и това е огромен масив. Как се работи с тях? Как се решава въпросът с тяхното цифровизиране?

ТОЙ.За нас е важно само едно: дали тези документи принадлежат към състава на архивния фонд или не. Тоест, те подлежат на постоянен срок на годност или не. И тогава, от гледна точка на употреба, изобщо няма значение дали това са документи от 11-и или 21-ви век. В това отношение те са равни. Друго нещо е, че естествено имаме осигурителен фонд и фонд за ползване на документи от 11 век. И тези уникални документи се раздават изключително рядко. Има специален държавен регистър на уникалните документи на Руската федерация, който е публикуван на уебсайта на Федералния архив и съдържа техните описания и електронни изображения.

PC Week: В тази връзка по-лесно ли е да се приемат за съхранение документи, преведени в електронен формат? Например промените в законодателството относно документацията на персонала влязоха в сила и архивите вероятно могат да я приемат в електронен вид?

ТОЙ.предполагам, да. Но няма никакъв смисъл държавният архив да взема съвременни документив момента няма персонал. За какво? Изчислете ли пенсията си? Има Пенсионен фонд, която създаде специализирана регистрация на граждани, от 2000г.

PC Week: Значи архивите не приемат записи, които са на 75 години?

ТОЙ.Не, пазим го дълго време. И сега активно преговаряме със същия Пенсионен фонд, за да намалим този период за хартиените документи от 75 на 15 години. Но пенсионният фонд се опасява, че електронната им система може да се срине.

А тези документи, които в крайна сметка ще дойдат при нас в електронен вид, са много голям и напълно отделен проблем. Това са въпроси относно електронно управление на документи, електронни документи. Как да ги приемате, как да ги съхранявате, е отделен въпрос.

PC Week: Все още не сте получавали такива документи?

ТОЙ.Не, те го правят. Материалите от преброяването на населението и земеделското преброяване са приети от ГАРФ в електронен вид. Друго нещо е, че тези преброявания съществуват само в електронен вид. Но все още няма масово приемане на бизнес документация. Тук има доста нерешени проблеми.

PC Week: А какво ще кажете за документите на ликвидирани организации? Приемат ли се за съхранение?

ТОЙ.Приемаме. Вярно е, че в случай на несъстоятелност и ликвидация на дружество, синдиците са длъжни да намерят пари, за да опишат документите на ликвидирани организации, но не винаги ги намират.

PC Week: Федералният архив управлява 15 федерални архива. Регионален архив в понастоящемпремахнати от контрола на вашия отдел?

ТОЙ.Да, няма пряк контрол върху тях. Те се подчиняват изпълнителни органисубекти на федерацията. Някъде това са независими архивни служби. Някъде и те като нас са включени в министерствата на културата. Някъде – в Министерството на правосъдието или директно в кабинета на губернатора. Но вертикалата на властта, която съществуваше в Съветския съюз и продължи до 2004 г., за съжаление, вече не съществува. Докато поддържаме методологическо единство. Как можем да помогнем на регионалните архиви. Представители на Федералните архиви участват в ежегодни събития, провеждани във всеки от тях федерален окръгнаучно-методически съвети. Веднъж годишно се провежда Архивният съвет, на който се събират архивисти от цялата страна. Тоест връзките остават. Шегуваме се, че архивистът е професия, в която във всеки град можеш да се окажеш без пари и неща, да дойдеш при колеги архивисти и те ще те приемат, хранят и изпращат вкъщи. Има братство, което всъщност не е характерно за никоя друга професия.

PC Week: Благодаря за чата.

В офиса често се налага изпращане на копия по електронна поща – електронни версии на печатни документи. Това могат да бъдат различни актове, фактури, писма, договори, харти, служебни бележкии всякакви други възможни документи.

Вкъщи имаме стари снимки, които се окаляха през годините и бихме искали да ги запазим.

За известно време ни подариха интересна книга, но искаме да я имаме с нас. Как да направя всичко? Нашите краткотрайни хартиени документи трябва да бъдат преобразувани в електронен вид, тоест дигитализирани и съхранявани.

Дигитализацията е преобразуване на изображение или аналогов аудио/видео сигнал в цифров формат, подходящ за запис на електронен носител.

За дигитализиране на изображения на обект има специални устройства - скенери. Има скенери за баркод, филмови скенери. Биометричните скенери разчитат модела на ретината на окото или папиларния модел на кожата на пръстите. Формата на триизмерен обект се чете от триизмерен 3D скенер.

В скенери за обработка на хартиени носители - рисунки, фотографии, текстови документи, изображението се осветява ред по ред със специална лампа, а отразеният светлинен поток се фокусира върху фоточувствителна матрица. Аналогово-цифровият преобразувател преобразува получените електрически сигнали в двоична система от данни, която образува цифрово копие на изображението.

Изборът на скенер зависи от задачите и спецификата на неговото приложение. Скенер в офис почти винаги се използва за дигитализиране на документи. Дори снимките да са сканирани, те не са обект на изисквания за високо качество в офиса. Разделителната способност от 300 dpi е напълно достатъчна, за да се гарантира точната работа на програмите за разпознаване и да се получи добро четим текст. Всеки скенер, произведен днес, осигурява резолюция, приемлива за работа в офиса.

Това важи и за дълбочината на цвета. Почти всеки модерен скенер възпроизвежда нивото на сив цвят, необходимо за отпечатани документи.

Важно е в офиса, където основната задача е бързо да се дигитализират текстови документи страница по страница, това е автоматизацията на процеса на сканиране. Могат да се използват листови скенери. Тук лист документ се вкарва в слота на машината и се изтегля, както при факс машина, по направляващите ролки. Такъв скенер е удобен с вградено автоматично устройство за подаване на листове. Зареждаме няколко листа от многостраничен документ в тавата и докато скенерът дигитализира, едновременно с това правим нещо друго. Тук всичко е просто. Ако е инсталиран съответният софтуер за OCR, едно натискане на бутон е достатъчно, за да се дигитализира и запише документ в желания формат на такъв скенер.

Модерно офис решение за отдел на инженерингова компания, например, може да бъде A3 скенер, включен в мултифункционално устройство заедно с A3/A4 принтер. На такова MFP е удобно да се дигитализират и правят копия на чертежи.

Ясно е, че няма да работи да сканирате подвързано списание или разпространение на книга на листов скенер.

За сканиране на двустранни документи има дуплексни скенери, при които два сканиращи елемента обработват двете страни на листа с един проход.

Добро решение за дома е цветно мастиленоструйно MFP. MFP е многофункционално устройство, което включва скенер и принтер. Такова устройство е и копирна машина. Тоест, MFP може автоматично да сканира документ и да отпечата копие от него - да създаде фотокопие на документа.

Компактното устройство с комбинирани функции заема по-малко място на масата. Цената му ще бъде значително по-ниска от общата цена на включените в него устройства, ако ги закупите отделно. На цветен мастиленоструен принтер правим висококачествени цветни снимки и визитки, а с плосък скенер дигитализираме документи, фотоалбуми или необходими книги.

В следващите уроци ще научим как ръчно да дигитализираме, конвертираме и запазваме текстови документи на плосък скенер, страница по страница.

В тези примери използвах популярно настолен MFP формат A4 за сканиране. Такова евтино устройство е най-доброто решение за дома и може да бъде второ, допълнително MFP в офиса.

Да предположим, че имаме многостранична логически свързан документ, който трябва да бъде дигитализиран и изпратен по имейл до нашия контрагент. Да го наречем "Договор".

В нашия любим Windows XP има стандартен „Помощник за скенер или цифров фотоапарат“. За да работи съветникът, скенерът трябва да е инсталиран на компютъра и да е активиран. Работата в съветника е много проста и има малко ръководство в урока Digitizing Documents in Windows XP.

В Windows 7 инструментът за създаване на електронни копия на отпечатани документи и изображения е стандартният компонент за факс и сканиране на Windows.

И така, прочетохме уроците и с помощта на една от тези програми получихме сканирани файлове на страниците на нашия договор в една от графични формати, запазени и моля, прикачете ги към имейл, изпратете на адреса.

Лошото тук е, че когато сканираме многостраничен документ с тези програми, няма да можем да комбинираме сканираните страници в един файл. Разбира се, можете да номерирате файловете на страниците по ред и да ги затворите, за да можете да ги изпратите компактно. Но нашият адресат ще може да разглежда страниците на свой ред само в графичен редактор, без да може да навигира в документа. Неудобно е и губи време. И като цяло неприемливо.

Всъщност, използвайки тези инструменти, ние получаваме отделни цифрови снимки на страниците на документ.

За да преобразуваме нашите разпръснати сканирания в единичен документс възможност за търсене в пълен текст, имате нужда от програма за разпознаване на текст. Най-доброто за днес е FineReader.

FineReader е програма руска компания ABBYY. Най-новата версия 12 на ABBYY FineReader беше пусната през февруари 2014 г. Тази програма извлича текстови данни от цифрови изображения - разпознава текстови знаци. Версията за оценка на ABBYY FineReader 12 Professional може да бъде изтеглена от официалния ресурс: http://www.abbyy.ru/finereaderи тренирайте 30 дни.

По-добре е, когато една от най-новите професионални версии е инсталирана на компютъра. Тук и по-долу е описана работата в ABBYY FineReader 10 Professional Edition.

И така, в предишните уроци сканирахме страниците със стандартни инструменти на Windows, номерирахме ги, записахме ги с разширението „jpg“ и ги поставихме в отделна папка, която нарекохме „Споразумение“.

Така че, използвайки прекрасните функции на програмата за разпознаване, можем лесно да конвертираме различни изображения в редактируеми формати.

Повече за това, моля, в следващия урок: Сканиране в ABBYY FineReader.

И така, ние четем тези уроци и виждаме какви предимства ни дава програмата за разпознаване. Вместо досадно и отнемащо време да пишете от книга или брошура, ние просто сканираме необходимите страници с FineReader, редактираме ги, ако е необходимо, и ги запазваме в избрания формат. Така че можете бързо да съставите например статия или резюме .

А как да сканираме страниците на книгите и да дигитализираме книги четем в темата: Дигитализиране на книга.

В заключение, нека обобщим темата: скенер в комбинация с програма за разпознаване е рационален заместител на писането от клавиатурата. Имайки хартиен вариант - текст, отпечатан на принтер или в печатница, вместо да въвеждаме от клавиатурата, ние просто го сканираме. Друга популярна област на приложение на скенера е дигитализацията на различни печатни продукти - етикети, пощенски картички, снимки, списания, книги.

Дигитализацията на документи е преобразуване на документи в цифров вид. Можете да дигитализирате рисунки, текстове и книги. Дейността на всеки средностатистически офис или институция рано или късно води до формирането в неговите стени голямо количестводокументи. Документите се съхраняват на рафтове и в чекмеджета на бюрото. Те заемат огромно количество място в офис шкафовете и на бюрата на служителите в офиса. Планини от документация, която е много трудна за разбиране и е почти невъзможно бързо да се намери един или друг документ. Така че офисът да не се превърне в архивно хранилище на документи, а служителите му могат бързо да работят с всякакви необходима документация, трябва да дигитализирате всички налични във фирмата документи и да ги прехвърлите от хартиен в електронен вид, като използвате услугите за сканиране и разпознаване на документи. Електронните документи са много по-лесни за обработка и съхранение. Те не заемат много място в офиса. Те не могат да бъдат загубени или повредени, а намирането на документ в дигитализиран електронен архив, където всичко е систематизирано и сортирано в пакети, е много по-лесно, отколкото в огромна купчина документи, съхранявани в офис шкаф. Дигитализираните документи са удобни и за използване в случай, когато служител на компанията отива в командировка или за преговори. Малко флаш устройство в джоба ви е в състояние да побере целия архив от документи на компанията и ще му даде възможност, ако е необходимо, бързо да намери всеки необходим документ. Много удобно и практично е да се използват дигитализирани документи, докато услугите за цифровизация на документи не са достатъчно скъпи и са достъпни не само за големи корпорации, но и за малки фирми и бюджетни организации.

Дигитализация на чертежи

Дигитализацията на чертежи, или както още се нарича векторизация, ви позволява да прехвърляте технически и архитектурни чертежи от хартиен в електронен формат. Услугите за цифровизация на чертежи могат значително да опростят и систематизират системата за архивно съхранение на проектната документация и са много подходящи и за двете промишлени предприятияи научни институти, както и за архитектурни и проектантски бюра, частни архитекти, студенти и всички, които според спецификата на своята работа или обучение работят с чертежи. По правило основният проблем при архивирането на проектната документация е търсенето на желания чертеж, условията, при които трябва да се съхранява чертежът, отпечатан на хартия Whatman, и неговата обемност. Дигитализацията на чертежи може ефективно да реши тези проблеми. Когато чертеж, благодарение на дигитализацията, се прехвърля от хартиен носителв електронен формат, за съхранението му не е необходимо да разполагате с големи архивни площи, а е достатъчно само малко свободно пространство на твърдия диск на компютър или друг електронен носител. В същото време е достатъчно да систематизирате съдържанието на архива веднъж, като разложите дигитализираните чертежи в тематични папки и впоследствие е лесно да намерите всеки необходим чертеж. Чертежите, съхранявани в електронния архив, не са подложени на механично натоварване, или на влиянието на други природни сили и елементи. Те не могат да бъдат намокрени, скъсани или загубени, а благодарение на системата за архивиране, можете да се предпазите сто процента от тяхната загуба или загуба. Работата с дигитализирани чертежи е много по-лесна, отколкото с хартиените им копия. Много по-удобно е да носите със себе си лазерен диск, на който винаги имате достъп до целия архив, отколкото обеми от големи документи и неудобни чертежи. Да, и покажете чертежа на клиента, където е по-удобно на монитора на компютър или лаптоп, но без да разгъвате многометрова хартия за рисуване на масата му. Да не говорим, че дигитализираният чертеж може просто да бъде изпратен чрез електронна поща, като същевременно спестявате както вашето време, така и времето на този, за когото е предназначена тази рисунка. Днес много компании предоставят услуги за дигитализиране на чертежи и с удоволствие констатираме факта, че нашата компания е един от лидерите в областта на цифровизирането на документи. Към днешна дата разполагаме с цялото необходимо оборудване и програми, за да осигурим дигитализация на всеки чертеж с пълно детайлно запазване на качеството му.

Дигитализация на текстове

Дигитализацията на текстове е метод за преобразуване на печатен текст от хартиен в електронен формат. Дигитализацията на текстове е незаменима като удобен инструмент за създаване на електронни архиви и като инструмент за преобразуване на книги и учебници в електронен формат. Сега любителите на литературното слово не трябва да седят с часове в библиотеките или да носят тежка и неудобна книга. Достатъчно е да имате електронен таблет, който лесно да се побере в джоба или чантата ви, и да четете всякаква художествена или справочна литература.

Дигитализация на книги

Дигитализацията на текста ви позволява да прехвърлите книга с всякакъв размер в цифров формат. Много е удобно и практично. В допълнение към лекотата на използване, заслужава да се спомене и очевидните икономически ползи. Далеч не винаги можете да закупите този или онзи учебник или книга за себе си и в същото време можете да го заемете от библиотеката или от приятел и благодарение на услугата за дигитализация да станете собственик на електронната версия, като харчите много по-малко пари за това, отколкото за закупуване на книга. Дигитализацията на книгите също така значително опрости процеса на съхраняване на редки ръкописи и книги с историческа стойност. В крайна сметка хартията не е вечна, но електронната версия на печатното слово наистина може да се съхранява в продължение на хиляди години и никога няма да загуби оригиналното си съдържание, запазвайки не само текста, но и илюстрациите за потомството.

СКАНИРАНЕ: Технологии

Какво е дигитализация?

02.10.2015 г., пт, 14:05 ч., Msk 2707

Сканиране, ретроконверсия и свързани услуги. Преглед на технологиите за преобразуване на документи в електронен вид.

Има няколко възможности за организиране на процесите на дигитализация. Те могат да се извършват самостоятелно или с аутсорсинг на услуги, с износ на документи или извършване на работа на тяхна територия. При дигитализация могат да се използват офисни, професионални документни или планетарни скенери. Данните могат да се извличат в ръчен, полуавтоматичен или автоматичен режим, с предварителна архивна обработка на хартиени документи или класификация на информацията вече в електронен вид и др.

Кой начин да избера?

Решението зависи от конкретна задача, тъй като всяко от горните "или" определя качеството на резултата и цената на работата. Например, въпросът за подвързаните документи е вечен: по-изгодно ли е да сканирате бавно в подвързано състояние или да харчите пари за зашиване, но бързо да ги дигитализирате на скенери за документи?

Най-лесният начин да изберете пътя, който работи най-добре за вас, е да потърсите експертния опит на организация за дигитализация. Интересува се от работата големи компанииТе ще проведат безплатно проучване и ще определят най-добрия подход за вас. Не пропускайте тази възможност и не очаквайте да се изкушите да поръчате услуги: повечето от тези компании също се интересуват от доставка на хардуер и софтуер за „направи си сам“ цифровизация.

Колко документа трябва да сканирате?

Определящият параметър е обемът на документите.

Определящият параметър е обемът на документите. За ежедневно сканиране на малки пакети бродирани документи (например първично счетоводство) е подходящ обикновен офис скенер, който може да издържи натоварване от няколко хиляди страници на ден. Просто трябва да го допълните с удобна програма за индексиране.

Редовното сканиране на големи обеми изисква професионално оборудване. Това са индустриални скенери, които струват много пари (такова оборудване се използва от Федералната данъчна служба, Федералната митническа служба и големите банки). Следователно рамково споразумение за предоставяне на периодични услуги за цифровизация може да бъде по-евтина алтернатива.

Самостоятелното преобразуване на големи ретроспективни масиви в електронна форма не е икономически оправдано: в допълнение към закупуването на оборудване и обучението на служителите, ще са необходими значителни разходи за труд и време. Определено е по-ефективно да поръчате услуга, тъй като голяма компания може да разпредели голям персонал и бързо да реши проблема.

Къде да сканирам документи?

Определящият параметър е търсенето на сканирани документи. Влияе ли изземването на документи върху дейността на организацията към момента на сканиране? Това е особено важно при дигитализирането на документи, до които служителите редовно имат достъп или които могат да бъдат внезапно поискани от регулаторния орган, както и за елиминиране на извънредни ситуации, свързани с документи. Примери: финансови и кадрови документи, техническа и експлоатационна документация, регистрационни книги и други браншови фондове.

Зона за сканиране, организирана в помещенията на фирмата-клиент на услугите.

Ако трябва да ги дигитализирате достатъчно бързо, тогава традиционният подход е да поръчате услуги с заминаването на екипа за сканиране на вашата територия. Често това се оказва по-евтино от доставката на документи до производството на изпълнителя и обратно, но всичко се определя от териториалната отдалеченост. Правилата за работа на терен означават сканиране на издадения случай в рамките на един или два работни дни, без продължително изтегляне от работния процес.

Трябва ли да бродирам документи?

Определяне на параметри: състоянието на документите и възможността за зашиване. Ако има такава възможност и хартията е подходяща за изтегляне със скенер за документи, тогава тя трябва да бъде бродирана. Факт е, че сканирането на подвързани документи на планетарен (книжен) скенер е няколко десетки пъти по-бавно от поточно цифровизацията. Пропорционално увеличете времето за работа и цената на труда. Сканирането на скенери за документи, дори като се вземе предвид фугирането, е по-бързо и по-евтино.

Можете да бродирате сами или можете да поверите това на художника.

Можете да бродирате сами или можете да го поверите на изпълнителя: ако бъде избрана реномирана компания, не трябва да се страхувате от загуба на документи. Напротив, стриктното регулиране на всички процеси и висококачествените материали позволяват на компаниите да се застраховат срещу допълнителни финансови загуби и увреждане на имиджа си. На този подход дори се вярва руски съдилища: при организиране на сканиране, обикновено по вътрешен ред, се допуска съединяване и последващо съшиване на съдебни дела.

Между другото, големите компании могат едновременно да извършват професионална архивна обработка: първо, част от работата вече се извършва за подготовка за сканиране, и второ, архивната обработка помага да се идентифицират непотърсени документи и да се намали обемът на сканираните масиви, което може да намали цена на работа.

Какво качество да изберете?

Днес всеки обект може да бъде сканиран с високо качество: от малка библиотечна карта до карти 8A0 и театрални декори.

Определяне на параметри: вид на документа и количество получен ресурс електронна форма. Днес оборудването за сканиране може да произвежда изображения с разделителна способност, варираща от 200 до 1200 точки на инч (dpi). За художествени произведения обикновено се използва разделителна способност от 400-600 dpi, което ви позволява да създавате висококачествени репродукции. | Повече ▼ високо качествоизползва се само когато е необходимо да се увеличи изображението и да се детайлизират малки предмети, като монети.

Подробните чертежи с нисък контраст, често направени върху паус и синьо, трябва да бъдат сканирани с резолюция 300-400 dpi и допълнителна обработка на изображения в графични редактори. Останалите документи обикновено се сканират при 300 dpi, което е достатъчно за отпечатване на копия без загуба на качество. Необходимото изрязване на изображение, геометрична корекция, корекция на цветовете, преобразуване в pdf, tiff, jpeg и др. формати могат да се извършват в напълно автоматичен режим чрез програми, вградени в оборудването за сканиране или доставени с него.

В повечето случаи се използва режимът на цветно снимане. Това е необходимо за всички документи, които са коригирани или подпечатани върху текста, за да се потвърди, че е взето електронно копие от оригиналния документ с печат и подпис, както и за четливостта на избледняващите текстове и за предаване на уникалните характеристики на оригинала. Не се обсъжда необходимостта от цветно сканиране на художествени произведения. Режимът "в сивото" се използва само в някои случаи: когато документите не съдържат цветни атрибути или когато е необходимо да се намали обемът на получения електронен ресурс.

Сканирането може да се извърши независимо. Основната задача е да се обучат служителите да работят правилно със сложно оборудване, тъй като качеството на получените изображения е важно за последващо индексиране: лошо сканиран документ, сенки, отблясъци и други дефекти на електронно изображение могат да направят важна информация нечетлива. Това ще предотврати прилагането на технологии за автоматично извличане на данни и може да доведе до грешки при индексиране. Качване на грешни данни в някои системи ( държавни регистри, счетоводни системи) не се допуска.

Индексиране

Обикновеното сканиране се използва рядко, тъй като при последваща работа ще бъде малко по-лесно да се търси информация в набор от графични файлове чрез обръщане на хартията. За да можете да търсите, е необходимо да изберете няколко атрибута (индексни полета) в документа.

Служители, участващи в масовото индексиране на документи чрез ръчно въвеждане.

Избраните атрибути могат да се добавят към името на файла. Тази практика се е развила в руските съдилища: за да може сканиращият оператор да няма достъп до вътрешните системи на съда, при цифровизирането всички необходими данни се въвеждат в името на файла. Впоследствие тези данни се признават от съдебната система при зареждане на всеки документ поотделно.

Но обикновено се качват дигитализирани документи информационна системагрупа, която изисква създаване на база данни. Така че, ако трябва да прикачите документ към вече съществуваща карта в счетоводната система, достатъчно е да извлечете няколко детайла, които уникално го определят - обикновено номер и дата.

Ако е необходимо да се формира база за търсене въз основа на самите документи, тогава количеството данни, които трябва да бъдат извлечени, се определя от задачата: от няколко детайла за търсене на файл в електронен архив до прехвърляне на цялата значима информация към аналитичен база данни (пълно име, адреси, TIN, KPP, дати, номера на документи за кандидатстване и др.).

Музеите, библиотеките и архивите прилагат свои собствени правила за индексиране при дигитализирането на складови единици и счетоводни документи. Отделна област на услугите е и векторизацията, която се използва по-специално при дигитализацията на ленти за регистриране (автоматично) и чертежи (ръчно изобразяване в CAD системи).

Колко данни да се извлече? Отговорът на този въпрос също е най-добре да се получи с помощта на експертни познания, тъй като броят на детайлите, които трябва да бъдат извлечени, зависи от функционалната задача и до голяма степен определя цената на цифровизацията. В някои случаи можете да се ограничите до колекции от документи, когато електронните изображения се комбинират под егидата на основния документ (например договор или регистър на сметки). При други е необходимо да се извлекат всички данни, съдържащи се в документа, за да се попълни картата на информационната система.

Примери за извличане на данни

Анализ на поръчките, направени на портала zakupki.gov.ru от компании с държавно участиеи държавни институции (44-FZ, 223-FZ), показва, че:

- За свързване на електронни копия на ОРД със системата за електронно управление на документи са достатъчни номера, датата и вида на документа.

– Сканирането на финансова документация често е придружено от извличане на номера, дата, имена и данни на платци, суми.

– Дигитализацията на архивни документи на общините (постановления на администрации, градски изпълнителни комитети, селски съвети и др.) с цел предоставяне на услуги и инвентаризация на обекти на поземлени и имуществени отношения изисква извличане на номера и датата на документа, всички пълни имена и адреси . Освен това адресите трябва да се сравняват с текущите директории на KLADR/FIAS.

– Дигитализацията на документи на Архивния фонд на Руската федерация е придружена от стриктно попълване на НСА и описание на фондовете в съответствие с архивното законодателство.

– Индексирането на описи и регистри предполага признаване на всички редовни записи.

– За да работите с чертежи в електронен вид, е необходимо да извлечете почти всички полета за печат.

– Сканирането на съставни случаи изисква не само извличане на детайлите на всеки документ, но и установяване на взаимоотношения. Най-трудният случай е проектната документация, където генерираната база данни има многостепенна йерархия и връзки към документи.