Оцифрування архівних документів технічні та технологічні проблеми. Як оцифрувати ваші документи

Оцифрування паперових архівів включає сканування і каталогізацію документів. Чим більшою є організація, компанія, тим складніше її документообіг, тим більше зберігається документів у її архівах і, відповідно, привабливіше виглядають послуги з оцифрування архівів.

Економія на пошуку

  1. Найчастіше для пошуку в архіві необхідного документадоводиться витрачати масу часу та зусиль. А може виникнути ситуація, коли той самий документ потрібен одразу кільком співробітникам – у такому разі доводиться робити його копію.
  2. Крім того, варто зазначити, що часте звернення до паперових документів рано чи пізно призводить до їх пошкодження, а іноді й “втрати”, якщо помилково розташувати справи в архіві.
  3. Адже вирішити всі ці проблеми досить просто – необхідно просто забезпечити оцифрування паперових архівів, використовувати в роботі автоматизовані інформаційні системи, які забезпечать оперативний пошук, а також доступ до електронних копій документів.
  4. Оцифрування паперових архівів має безліч переваг. І йдеться не лише про якісно нові можливості з надання та використання документації компанії, а й про забезпечення збереження цієї інформації.

Вигода від оцифрованих документів:

  • зменшення навантаження на паперовий архів та ділянку ксерокопіювання;
  • можливість вивільнення архівних площ;
  • скорочення витрат утримання паперових архівів.

Оцифрування паперових архівів: етапи

Перший етап.Усі роботи з оцифрування архівів починаються з експертизи документів. В результаті аналізу документів визначається структура паперового масиву, а також кількісні та якісні характеристикидокументів. На основі результатів експертизи здійснюється вибір технології та оцифрування документів, критеріїв оцінки якості, вибір складу обладнання, погоджуються терміни виконання та бюджет.

Другий етапє безпосередньо сканування. Оцифрування архівів є процес створення графічних образів документа з використанням сканерів. Перед тим, як перекладати документ у електронний вигляд, оператор підбере оптимальний режим сканування, проведе, власне, сканування, контролюючи при цьому якість зображень на моніторі.

Ефект від впровадження електронного архіву

Результатом оцифрування паперових архівів є електронні копії документів. Професійне обладнання, яке використовує наша компанія, дозволяє сканувати різні документизі швидкістю до кількох тисяч сторінок на день – у пакетному режимі. Отримані файли записуються на флешки, CD, DVD та інші носії.

Підсумки оцифрування архіву

Відразу після завершення оцифровування архівів, графічні образи проходять автоматизовану обробку - поділ по сторінках розворотів, обрізку по краях, вирівнювання по рядках, видалення шумів, поліпшення якості образів і так далі. Параметри для каталогізації відсканованих документів ви зможете поставити на власний розсуд, тим самим забезпечивши оптимізацію бізнес-процесів з боку документознавства.

В офісі часто буває потрібно переслати електронною поштоюкопії – електронні версії друкованих документів. Це можуть бути різні акти, рахунки-фактури, листи, договори, статути, службові запискита будь-які інші можливі документи.

Вдома у нас є старі фотографії, які з роками старіють, і ми хотіли б їх зберегти.

Нам дали на якийсь час цікаву книгу, а хочеться мати її у себе. Як це все зробити? Наші недовговічні паперові документи треба перетворити на електронний вигляд, тобто оцифрувати та зберегти.

Оцифрування – це переклад зображення, або аналогового аудіо/відеосигналу в цифровий формат, придатний для запису в електронний носій.

Для оцифрування зображень об'єкта існують спеціальні пристрої – сканери. Є сканери штрих-кодів, сканери кіноплівки. Біометричні сканери зчитують малюнок сітківки ока чи папілярний малюнок шкіри пальців руки. Форму об'ємного об'єкта зчитує тривимірний 3D-сканер.

У сканерах для обробки паперових носіїв– малюнків, фотографій, текстових документів, зображення рядково висвітлюється спеціальною лампою, і відображений світловий потік фокусується на світлочутливій матриці. Отримані електричні сигнали аналогово-цифровий перетворювач перетворює на систему двійкових даних, яка утворює цифрову копію зображення.

Вибір сканера залежить від завдань та специфіки його застосування. Сканер в офісі майже завжди використовується для оцифрування документів. Навіть якщо скануються фотографії, в офісі до них не висуваються високі вимоги якості. Дозвіл у 300 dpi цілком достатньо для забезпечення точної роботи програм розпізнавання та отримання добре читаного тексту. Будь-який сканер, що випускається сьогодні, забезпечує прийнятний для офісних робіт дозвіл.

Це стосується і глибини кольору. Майже кожен сучасний сканер відтворює потрібний для друкованих документів рівень кольору сірого.

Важливо в офісі, де основним завданням є швидке оцифрування текстових документів, це - автоматизація процесу сканування. Можуть застосовуватися листопротяжні сканери. Тут лист документа вставляється в щілину апарата і простягається, як і у факсі, по напрямних роликах. Такий сканер зручний із вбудованим автоподатчиком аркушів. Завантажуємо в лоток кілька аркушів багатосторінкового документа, і поки сканер виконує оцифрування, паралельно займаємося іншою справою. Тут усе просто. Якщо встановлена ​​відповідна програма розпізнавання тексту, для оцифрування та збереження документа в потрібному форматі на такому сканері достатньо натиснути одну кнопку.

Сучасним офісним рішенням для відділу проектної компанії, наприклад, може бути сканер формату А3, що входить у багатофункціональний пристрій разом з принтером А3/А4. На такому МФУ зручно оцифровувати та робити копії креслень.

Ясно, що зісканувати журнал або розворот книги на листопротяжному сканері не вийде.

Для сканування двосторонніх документів існують дуплексні сканери, де два скануючі елементи обробляють обидві сторони аркуша в один прохід.

Хорошим рішенням для будинку є кольоровий струменевий БФП. МФУ - це багатофункціональний пристрій, що включає в себе сканер і принтер. Такий пристрій одночасно є копіювальним апаратом. Тобто, МФУ може автоматично сканувати документ і друкувати його копію - створювати фотокопію документа.

Компактний апарат із суміщеними функціями займає менше простору на столі. Вартість його буде істотно нижчою від сумарної вартості пристроїв, що входять до нього, якщо купувати їх окремо. На кольоровому струменевому принтері ми робимо якісні кольорові фотографії та візитки, а планшетним сканером оцифровуємо документи, фотоальбоми або потрібні книги.

У наступних уроках ми повчимося вручну посторінково, на планшетному сканері оцифровувати, перетворювати та зберігати текстові документи.

У цих прикладах я використовував популярний настільний МФУ формату А4. Такий недорогий пристрій є оптимальним рішенням для дому і може бути другим додатковим МФУ в офісі.

Припустимо, що ми маємо багатосторінковий логічно пов'язаний документ, який потрібно оцифрувати та відправити на мейл нашому контрагенту. Назвемо його "Договір".

У улюбленій нами Windows XP є стандартний «Майстер роботи зі сканером або цифровою камерою». Щоб майстер запрацював, на комп'ютері має бути встановлений сканер, і він має бути увімкнено. Працювати у майстрі дуже просто і в уроці оцифровування документів у Windows XP є невеликий посібник.

У Windows 7 інструментом для створення електронних копій друкованих документів та зображень є стандартний компонент "Факси та сканування Windows" .

Отже, ми почитали уроки і за допомогою однієї з цих програм отримали файли сканів сторінок нашого договору в одному з графічних форматів, зберегли, та будь ласка, прикріплюємо їх до електронного листа, відправляємо за адресою.

Погано тут те, що при скануванні багатосторінкового документа цими програмами ми не зможемо поєднати скани сторінок в єдиний файл. Звичайно, можна пронумерувати файли сторінок по порядку та заархівувати їх, щоб компактно переслати. Але адресат наш зможе лише по черзі переглядати сторінки у графічному редакторі, не маючи можливості навігації за документом. Це некомфортно та вбиває час. І, взагалі, неприйнятно.

Фактично, використовуючи ці інструменти ми отримуємо окремі цифрові фотографії сторінок документа.

Щоб перетворити наші розрізнені скани на єдиний документз можливістю повнотекстового пошуку, потрібна програма розпізнавання тексту. Найкращою на сьогодні є FineReader.

FineReader – це програма російської компанії ABBYY. Останній ABBYY FineReader дванадцятої версії випущений у лютому 2014 року. Ця програма отримує текстові дані з цифрових зображень - розпізнає символи тексту. Ознайомчу версію ABBYY FineReader 12 Professional можна завантажити з офіційного ресурсу: http://www.abbyy.ru/finereaderта потренуватися протягом 30 днів.

Краще, коли на комп'ютері інстальовано одну з останніх pro-версій. Тут і далі описується робота в ABBYY FineReader 10 Professional Edition.

Отже, в попередніх уроках ми насканували сторінок стандартними інструментами Windows, пронумерували їх, зберегли з розширенням "jpg" та помістили в окрему папку, яку назвали "Договір".

Ось так, використовуючи чудові можливості програми розпізнавання, ми легко перетворюємо різні зображення в формати, що редагуються.

Про це, будь ласка, у наступному уроці: Скануємо в ABBYY FineReader.

І ось, ми почитали ці уроки і бачимо, які переваги дає нам програма розпізнавання. Замість нудного і трудомісткого набору тексту з книги, або брошури, ми просто скануємо потрібні сторінки FineReader"ом, редагуємо їх, якщо треба, і зберігаємо у вибраному форматі. Так, можна швидко зверстати, наприклад, статтю або реферат.

А як сканувати сторінки книг і оцифровувати книги читаємо в темі: Оцифровка книги .

На закінчення теми підсумуємо: сканер разом із програмою розпізнавання - раціональна заміна набору тексту з клавіатури. Маючи паперову версію - надрукований на принтері або друкарні текст, ми замість введення з клавіатури просто скануємо його. Іншою популярною сферою застосування сканера є оцифрування різноманітних друкованих продуктів – етикеток, листівок, фотографій, журналів, книг.

У вас розпочалися серйозні проблеми зі зберіганням паперових документів? Полиці ломляться від папок, що безглуздо роздулися, і ви по три години шукайте потрібний папірець? Тоді настав час зайнятися оцифровкою документів, яка зробить ваш кабінет чи квартиру чистішою, а спосіб пошуку більш простим та зручним. Створіть власну електронну бібліотеку, редагуйте, копіюйте та переміщуйте цифрові файли за власним бажанням. Можливість створення цифрових документів - один із благ цивілізації. Тож скористайтеся ним!

Перш, ніж наважитись на оцифрування своїх документів, вам слід знати, що зберігати їх можна двома способами - у вигляді зображень та у вигляді текстових файлів. Зберігання зображень потребує значно більше місця на жорсткому диску, але ви зможете зберегти стиль вихідного документа. Перетворення відсканованих зображень у текстовий файл вимагатиме додаткових витрат часу, тому що необхідно здійснити процес оптичного розпізнавання символів OCR (правда, якщо бути точним, то ця назва не зовсім вірна, тому що тут йдеться про роботу з цифровою інформацією, проте, як це нерідко буває термін прижився).

Як вибрати формат зберігання документів? Дуже просто: якщо оригінал документа написано від руки, і вам важливо зберегти його «характерність» (лист від коханої людини) або якщо документ є, наприклад, твором мистецтва, то збережіть його у вигляді зображення (іноді відомий почерк настільки ж важливий, як та написані слова). Іншою більш прозовою причиною для збереження рукописних документів у вигляді зображень є відсутність комерційно доступного програмного рішення, придатного для інтерпретації рукописних символів. Поки що ця технологія застрягла в КПК та планшетах, у яких вона реалізована трохи інакше, ніж нам потрібно. Працюючи з планшетом, ви пишіть символи "від руки", вводячи їх по порядку, а програма в режимі реального часу перетворює їх на друкований текст. Розпізнавання почерку окремо взятої людини з відсканованого документа – справа майбутнього.

Сканери

Незалежно від того, як ви будете зберігати ваші документи - у вигляді зображень або у вигляді текстових файлів, вам знадобиться сканер для їх оцифровки. Якщо ви хочете оцифрувати порівняно не велика кількістьдокументів, багатофункціонального принтера або планшетного сканера вам буде цілком достатньо. Єдиний їхній недолік - відносно повільна швидкість роботи. Майте на увазі, що тільки дорожчі моделі мають функцію автоматичної подачі аркушів для обробки багатосторінкових документів.


Серед найкращих моделей назвемо ScanSnap S1500 від Fujitsu та ScanJet Professional 3000 від HP. Швидкість сканування документів цих пристроїв становить у середньому 20 сторінок за хвилину та вище. При цьому ScanJet Professional 3000 відрізняється більш надійним механізмом подачі паперу, тоді як ScanSnap S1500 має більш досконале програмне забезпечення. Обидва сканери знаходяться приблизно в одній ціновій категорії, тому вибирати вам.

OCR - софт

Більшість сканерів поставляються з програмним забезпеченнямдля здійснення OCR, яке встановлюється на вашому комп'ютері. Якщо ви незадоволені супутнім програмним забезпеченням або його немає, то подібні програми річ досить поширена і їх можна придбати окремо. Існують такі ринкові пропозиції:

FineReader 9 Express від ABBYY, $100 за звичайну та $400 за професійну версію програми Pro 10;
. OmniPage 17 Standard від Nuance, $150 за звичайну версію програми та $500 за професійну;
. Acrobat X Standard від Adobe, $299 за звичайну версію та $449 за професійну;
. PaperPort 12 Standard від Nuance коштує $100 за звичайну та $200 за професійну версію ПЗ, правда тут немає функції OCR, тільки варіант управління відсканованими документами.

Розширення

Для документів, що зберігаються у вигляді зображень, як правило, достатньо виставити роздільну здатність від 150 до 200 точок на дюйм, проте OCR - софт працює набагато краще, якщо зображення збережені у вищій роздільній здатності - 300 пікселів на дюйм. Все залежить від того, що вам потрібно. Якщо ви хочете зберегти хоча б мінімальну читабельність відсканованого документа, можете знизити вимоги до дозволу. Якщо для вас важливо висока якістьвідповідно, збільште його.

OCR у веб

Існує кілька онлайн-сервісів, які надають послугу розпізнавання сканованих документів. Серед найвідоміших назвемо безкоштовні ресурси Free OCR , NewOCRі OCR Online. Вони чудово підходять для невеликих проектів, тобто працюють лише з невеликими за обсягом документами. Спочатку ви повинні відсканувати оригінал у пам'ять комп'ютера, а потім завантажити зображення на веб-сайт. Звичайно, на кожному з ресурсів існують свої обмеження як за обсягом, так і за змістом документа. Так, веб-програми розпізнають виключно текст, без ліній або додаткових символів, які є на сторінці.

Сервіс Free OCRє безкоштовним, однак розмір файлу, що завантажується, не може перевищувати 2 Мб і не містити не більше ніж 5000 пікселів, а це приблизно 50 точок на дюйм для документа звичайного стандарту. Причому ви зможете обробити не більше 10 подібних документів на годину. Послугами сайту NewOCRви також можете скористатися безкоштовно, але його інтерфейс вкрай примітивний, зате обсяг документів, що обробляються, в 2,5 рази більше - до 5 Мб. І, нарешті, ресурс OCR Onlineвимагає створення безкоштовного облікового запису, але дозволяє завантажувати до 15 файлів на годину об'ємом до 4 Мб у роздільній здатності близько 200 точок на дюйм на сторінці. Якщо вас такі обсяги не влаштовують, то можна купити платний доступ за $3.95 (8 центів за сторінку) та отримати можливість обробити до 50 документів за раз або заплатити $49.95 за обробку до 5000 (1 цент за сторінку). Цей веб-програма працює як з текстом, так і з графічними елементами, проте йому, природно, далеко до стандартів Acrobat X або FineReader 10.

E-книги

Напевно, ви, як і я, любите запах справжньої книги, любите відчуття щільного паперу та вигляд гарної графіки. Однак сьогодні все більше і більше людей вважають за краще мати справу з електронними книгами, для читання яких використовуються так звані спеціальні читалки, планшети, смартфони, плеєри та інші портативні пристрої. Велика кількістьінтернет-магазинів пропонує просто величезні обсяги контенту. Але що, якщо ви захочете мати власну колекцію е-книг, які не доступні в цифровому форматі?

Щоб перетворити ваші улюблені «фізичні» книги на електронні, потрібно їх спочатку відсканувати, а потім перевести в текстовий формат за допомогою програми OCR. Це стомлює навіть якщо ви використовуватимете дуже швидкий FLATBED-сканер. Такі сканери нагадують «ксерокси», маючи притискну кришку, тому вони можуть сканувати не лише окремі аркуші, а й книги цілком. Якщо ж ви готові розпорошити улюблену книгу, то можете використовувати SHEETFED-сканер, яка працює за принципом факсу, тобто з окремими сторінками (як ScanSnap S1500 від Fujitsu і ScanJet Professional 3000 від HP).

Після того, як ви перекладете свої документи, підручники або книги у формати PDF, Word або fb2, ви можете скористатися спеціальними програмамидля організації, редагування чи читання електронних документів. Наприклад, Calibre чи Stanza. - Безкоштовний органайзер та редактор для вашої колекції електронних книг. Програма допомагає працювати з каталогом - організовувати, класифікувати, коментувати, шукати, зберігати нові та старі книги на жорсткому диску комп'ютера або в пам'яті е-рідера.

Чим про більшу організацію, компанії йдеться, тим більше зберігається документів у її архіві, тим складніше її документообіг, тим більше привабливо виглядають послуги з оцифрування архівів. Отже, що таке оцифрування архівів - це процес сканування та каталогізації документів.

Незручності під час роботи з паперовими архівами

Так, у великих архівах на пошук потрібного документадуже часто доводиться витрачати багато часу зусиль. Крім того, документи, що найчастіше використовуються, з часом можуть бути пошкоджені або взагалі "втрачені", якщо їх помилково розташували в архіві. Нерідко у будь-якому вигляді бізнесу трапляються ситуації, коли потрібна висока оперативність у наданні інформації: буває потрібно швидко підготувати документи для підписання, зробити паперові чи цифрові копії, акуратно скинути – при роботі з паперовими архівами оперативність втрачається. Це не повний перелік незручностей, із якими доводиться зіштовхуватися під час роботи з паперовими архівами. Але при цьому існує досить простий та елегантний спосіб вирішення проблеми – оцифрування документів.

Переваги оцифрування архівів?

  • Варто відзначити зменшення навантаження на паперові архіви, а також на ділянку ксерокопіювання. Так, тепер якщо одночасно кільком співробітникам організації знадобився один документ, його не обов'язково ксерокопіювати.
  • оцифрування документів дозволяє суттєво скоротити витрати на утримання паперового архіву, і навіть звільнити певну площу, раніше використовувану під зберігання паперових архівів.

Як відбувається процес оцифрування документів?

  • Спеціально навчені фахівці займаються сортуванням документів (на території вашої компанії або доставляють їх на територію організації, що займається оцифруванням архівів), потім за допомогою сучасних сканерів проводять оцифрування архівного фонду в повному обсязі або окремих документів.
  • Штрих-коди та друковані документи системою оптичного розпізнавання символів автоматично перетворюються на електронний вигляд. При цьому зберігаються ключові реквізити документів: назва, дата, тип, контрагент тощо.
  • Для того, щоб уникнути можливого спотворення при передруку контактних даних, телефонів для оцифрування рукописної інформації при оцифровці архівів застосовується система подвійного введення. Тобто оцифрування документів у майбутньому дасть вам можливість здійснювати повноцінний оперативний пошук за ключовими словами або пошук за певними типами документів/контрагентів.

Керування файлами

Електронні архіви дозволяють керувати файлами, отриманими від сканування. Після оцифрування архівів паперові документи підлягають систематизації та опису. Вони брошуруються, складається систематизований повний каталог документів з урахуванням потреб та специфіки компанії-замовника. Це дозволяє надалі суттєво економити сили та час під час роботи з архівами.

Роботи з оцифрування архівів

І.Є. Хворова

Процес оцифрування документів для створення електронного архіву

Стаття присвячена процесу оцифрування - найзручнішому механізму збереження та використання інформації в сучасних умовах. Автор розглядає основні моменти процесу оцифрування архівних матеріалів, включаючи аналіз можливих способівпереведення документів в електронний вигляд, категорії документів для оцифрування, формати зберігання електронних документів та дослідження сучасних стандартів оцифрування. Також у статті аналізуються необхідні умовидля створення віртуального архіву історичної персоналії чи події у сучасному контексті. Особливу увагуавтор приділяє особливостям організації електронного ресурсу, досліджує існуючі сучасні проекти з цієї тематики та аналізує можливі труднощі, з якими може зіткнутися дослідник під час створення електронного архіву.

Ключові слова: оцифровка, архівний документ, електронний фондкористування, віртуальний архів.

Реалії сучасного життядедалі частіше вимагають від нас активного використання нових інформаційних технологій. Інформаційна епоха вносить свої корективи також у світ діалогу архівних джерел та дослідника. Сучасні цифрові технології дозволяють здійснювати найглобальніші ідеї щодо створення альтернативного поля зберігання - зберігання документів у віртуальній площині.

Оцифровка архівних документів на сьогоднішній день є найзручнішим інструментом для збереження та використання інформації. Вона дає можливість для безпечного та більш економічного зберігання, зручного пошуку та використання.

© Хворова І.Є., 2017

інформації, а також для оперативного доступу до матеріалів архіву. Процес оцифровування документів ґрунтується на ідеї формування єдиного електронного фонду користування (далі -ЕФП). ЕФП є сукупністю електронних копій архівних документів, які записані на цифрові носії та призначені для використання замість оригінальних документів1. p align="justify"> Важливим моментом при створенні ЕФП є необхідність регламентації процесу його створення.

На думку заступника керівника Федерального архівного агентства О.В. Наумова, основні цілі оцифровування документів полягають у розширенні та спрощенні доступу до документів архівного фонду, забезпеченні збереження оригіналів шляхом поступового виведення їх з обороту використання, надання доступу до електронного фонду, а також у прискоренні процесу надання державних послуг2.

Розглянемо основні моменти процесу оцифрування. Насамперед, необхідно враховувати, що архівний фонд Російської Федераціїзберігає великий документальний масив. Таким чином, перш ніж розпочати сканування самих документів, доцільно провести оцифровку науково-довідкового апаратуархів, створити електронні описи для пошуку даних. Початкове оцифрування описів архіву дає можливість користувачеві не виходячи з дому познайомитися з переліком документів, що зберігаються, і замовити цікаві документи по Інтернету. При цьому необхідно також враховувати факт науково-технічної редакції заголовків справ - тільки якщо опис удосконалено, можна розпочинати оцифрування фонду.

Категорії документів для оцифрування включають не тільки документи, для яких існує загроза втрати інформації, але також найбільш цінні, унікальні матеріали і затребувані документи. Критерії документів про унікальність та цінність документів дещо розмиті, а затребуваність не є постійною величиною, тому при виборі матеріалів оцифровки часто виникає питання: які документи необхідно переводити в цифровий вигляд насамперед? Можливо, добитися результативнішої вибірки буде простіше, якщо в процесі відбору візьмуть участь не лише члени експертної комісіїархіву, але також і залучені професіонали – історики, політологи, соціологи, громадські діячі та ін. Процес створення такої робочої групи потребує чіткої регламентації. Слід зазначити, що, попри сформульовані критерії отбора3, вони є обов'язковими і регіональні архіви

вправі самі вибирати ті документи, які необхідно оцифрувати насамперед.

Вибір способу оцифровки важливий, так як носій і формат представлення матеріалу також несе корисну для роботи дослідника інформацію, тому дуже важливо передати її в найбільш точній, порівнянної з першотвором формі.

У безпосередній оцифровці документів важливо дотримуватися всіх заходів безпеки під час роботи з оригіналом, особливу увагу необхідно приділити при скануванні книг і давніх актів (світло, принтер, поведінка фахівця при оцифровці повинні відповідати прийнятим нормам). У цьому етапі ключову роль грають фінансові можливості проекту з оцифровці - вибір устаткування сканування визначає рівень безпеки цього процесу для оригіналу. Вибір найбільш економічного апаратного пристрою неминуче тягне за собою ризик завдати непоправної шкоди документам, а також скорочує шанси на створення порівнянної, повнокольорово замінює оригінал копії4.

При оцифровці документа робиться мінімум дві копії оригіналу - робоча копія та майстер-копія. Обидва матеріали мають бути замарковані та зареєстровані у спеціальному реєстрі. Завдяки такій системі реєстрації пошук відсканованого документа буде швидшим та комфортнішим для користувача, а облікові дані дозволять легко відстежувати документ у загальній інформаційної системиархів.

Серед форматів зберігання зображень найбільшого поширення в архівістів набули формати TIFF та JPEG. Формат TIFF своєю популярністю завдячує можливості збереження якості зображення завдяки алгоритмам стиснення даних без втрат. Формат JPEG має можливість високого ступеня стиснення, але при цьому відбувається втрата якості зображення. Зміни можуть бути непомітні неозброєним поглядом, але стисло зображення буде відрізнятися різкими контрастами або пікселями. Тому JPEG не можна використовувати як проміжний формат для обробки зображень. У JPEG можна зберігати лише остаточний варіант. Що стосується інших різновидів електронних документів та найбільш кращих форматів їх зберігання, то існують текстові документи (ms-word, txt, pdf, html, xml, rtf), відео (mov, avi, mpeg, mp4) та аудіо (wav, aiff, mp3), креслення (autocad), графіки та схеми (tiff, pcx), БД у вигляді електронних таблиць та реляційних баз даних (xls, xml, html, mdb). Для фотодокументів також прийнятний формат PDF. Отриманий масив даних може використовуватися для передачі цифровими каналами,

зберігатися на цифровому оптичному носії (одноразово записувані CD-R, DVD-R, багаторазово записувані CD-RW, DVD-RW, DVD-RAW диски), магнітному (жорсткі диски, гнучкі магнітні диски, магнітні стрічки), Flash-накопичувачах тощо д.

Вимоги до якості цифрових копій, що одержуються, чітко не сформульовані. Відсутні критерії оцінки якості електронних копій паперових документів: параметри зображення, тонове відтворення (контрастність), яскравість, шум, точність кольору, різкість, роздільна здатність, геометричні спотворення та ін. За кордоном вже використовується ряд документів, досвід яких у галузі оцінки якості оцифрованих документів був б корисний для Росії. Національний стандарт США ANSI/AIIM MS44 «Керівні вказівки для контролю якості сканерів зображень» встановлює та розкриває базову термінологію, основні параметри та критерії оцінки якості сканування, а також підходи до їх практичного вимірювання. На його основі з урахуванням сучасних вимог у 2000 р. було розроблено міжнародні стандарти ISO для оцінки якості сканування чорно-білих документів.

Після оцифровки оригінал повертається назад на зберігання до архіву, а зроблені копії поповнюють електронний фонд користувача і стають доступними для дослідників.

Пошук вирішення проблеми зберігання та оперативного використання архівних документів розпочався ще в середині 1990-х рр., коли Бібліотека Конгресу США приступила до тотального оцифрування наявних зборів мікрофільмів (як самостійної колекції та як основного носія страхового та користувальницького фондів). У процесі оцифровки американські фахівці зіткнулися з необхідністю вироблення єдиних підходів до реалізації процесів переведення інформації з матеріальних носіїв в електронний вигляд, тобто виникла потреба у регламентації процесів оцифрування.

Сучасні стандарти оцифровки за рівнем їхньої регламентації можна розділити на 3 категорії стандартів: міжнародний, національний та стандарт організації. Міжнародний стандарт ISo5 розробляється групою вчених, його використання дає технологічну, економічну та соціальну переваги, але не є обов'язковим для жодної країни - учасниці організації ISO. Національний стандарт є обов'язковим для використання органами державної владирізних рівнів, він розробляється для покращення процедури оцифрування з урахуванням особливостей законодавства, стандартів документа-

ції у певній країні. Стандарт організації підкреслює специфіку конкретної компанії у процесі переведення документа в електронний вигляд та його подальше зберігання та використання. Найбільш відомим національним стандартом, регламентуючим процеси оцифрування, є «Стандарт оцифрування S6» (S6: Digitisation Standard)6, введений у дію національним комітетом зі стандартизації Австралії та Нової Зеландії в 2006 р.7 На жаль, у Росії немає аналогічного документа, що регламентує процеси оцифрування та створення .

У 2012 р. співробітниками Всеросійського науково-дослідного інституту документознавства та архівної справи (ВНДІДАД) та Федерального архівного агентства (Росархів) були розроблені « Методичні рекомендаціїз електронного копіювання архівних документів та управління отриманим інформаційним масивом». Моделью цих рекомендацій стали «Стандарт оцифровки S6» і «Технічні рекомендації» FADGI. З метою продовження робіт у цьому напрямі є доцільним виробити Стратегію розробки та оновлення галузевих нормативно-методичних актів, що регламентують різні напрямки діяльності в галузі інформатизації архівної справи, а також створити регламент та перспективний планщодо її реалізації. Розробниками було виділено ключові моменти, які необхідно враховувати під час підготовки регламентуючого документа

1. Структура та зміст розроблених та введених у дію документів міжнародних та національних систем стандартизації обумовлені специфікою правової базикраїни, де вони виникли. Тому їх прямий переклад і використання Російської Федерації вимагають виваженого підходу.

2. Необхідне створення не одного нормативного документа, що регламентує питання оцифрування, а комплексу нормативно-правових актів, що описують вимоги до всіх етапів та аспектів цього процесу.

3. Структура і загальний зміст цієї нормативно-методичної документації можуть бути побудовані на зарубіжних аналогах, обраних експертами галузі як приклади, найбільш близькі і адекватні російським умовам. При цьому вітчизняні розробки повинні в повному обсязі відображати специфіку всіх процесів та аспектів оцифровки (включаючи вимогу до обладнання, персоналу, процедур та менеджменту якості), властиву России8.

Оцифрування документів - необхідний захід для організації оперативного доступу до документів архіву. Наявність безумовно-

го масиву документів дозволяє створити новий, комфортний для користувача науково корисний інформаційний ресурс - віртуальний архів. Приклади таких віртуальних сховищ можна побачити на сайті Українського державного архіву літератури та мистецтва.

Віртуальний архів І.А. Буніна є ресурсом із зручною класифікацією представлених документів і комфортним для користувача інтерфейсом. Документи поділені на три групи: «Рукописи», «Вирізки з газет і журналів», «Образотворчі матеріали» і є скановані копії оригіналів фондів Російського державного архіву літератури та мистецтва та Архіву російського зарубіжжя у м. Лідсі9. Розробники проекту позначають ключові моменти щодо реалізації подібних проектів: фінансові питання, проблема роз'єднаності архівних документів та необхідність переговорів із сховищами різних установ і навіть країн для збору необхідного матеріалу та, нарешті, вирішення питань юридичного характеру – оскільки на електронну публікацію матеріалів також поширюється авторське право. Ресурс є позитивним прикладом реалізації проекту зі створення віртуального архіву. Сайт Російського державного архіву літератури та мистецтва також пропонує ознайомитися з такими чудовими прикладами електронних сховищ, як ресурс, присвячений документам. Вітчизняної війни 1812 р. та Першої світової війни.

Творцями електронного сховища під назвою «Об'єднаний віртуальний архів Осипа Мандельштама» стали Оксфордський університет та Мандельштамівське товариство. Розробники проекту ставили за мету виявити, описати та розмістити в Інтернеті все або максимально велику кількість збережених творчих та біографічних матеріалів Осипа Мандельштама незалежно від місця їх фізичного розташування10. При цьому у проекті поєднуються рукописи, транскрипти текстів, а також коментарі до них.

Пошуки документів - найважливіший етап під час створення такого роду проектів. Цей процес ускладнюється тим, що деяких із раніше відомих та введених у науковий обіг колекцій, можливо, більше не існує. Потрапивши у продаж 1990-ті рр., вони змінили власників, навіть імена яких який завжди можна встановити. В інших випадках власники не в змозі виявити ті чи інші автографи або документи. Це цілком пояснюється тим, що комплектування архівно-рукописних фондів документами

діячів російського зарубіжжя здійснювалося переважно шляхом дарування і носило систематичного характера11. Розробники відзначають, що те саме трапляється і з державними архівами. Так було в Національному архіві Франції протягом багатьох років було неможливо знайти матрикуляційні документи О.Э. Мандельштама (вони були виявлені в квітні 2008 р.)12.

Важливо відзначити, що віртуальний архів О.Е. Мандельштама не тільки є вдалим прикладом реалізації подібного проекту, але також, завдяки докладному опису процесу створення такого архіву на сайті, представляє своєрідне навчальний посібникдля продовжувачів та дослідників процесу оцифрування.

Аналіз реалізованих російських проектів зі створення віртуальних сховищ історичних матеріалів наголошує на проблемі роз'єднаності документів та складності їх пошуку. Таким чином, під час підготовки проекту важливо акцентувати увагу на можливій співпраці із закордонними архівами.

Таким чином, зростає роль спільних робіт, спільних проектів створення єдиного віртуального поля зберігання матеріалів однієї тематики.

При оцифровці необхідно приділяти увагу процесу вибірки документів для переведення їх у цифровий вигляд, а також підбору якісного обладнання для забезпечення безпечного для оригіналів процесу оцифровки. Проте на даний момент одним із найсерйозніших питань у цій тематиці залишається необхідність регламентації процесу оцифрування (включаючи докладний описпроцесу вибірки матеріалів та закріплення термінологічної бази). Без відповідного, затвердженого законом стандарту, процес створення віртуального архіву залишається трудомістким і недосяжним для більшості дослідників.

Примітки

Методичні рекомендації з електронного копіювання архівних документів та управління отриманим інформаційним масивом. [Електронний ресурс] URL: http://archives.ru/documents/rekomend_el-copy-archival-documents/razdel-2.shtml (дата звернення: 13.05.2016). Особливості оцифрування документів у сучасних архівах. [Електронний ресурс] URL: https://www.pcweek.ru/ecm/article/detail.php7ID-154329 (дата звернення: 13.05.2016).

Юмашева Ю.Ю. Архіви та «цифрові перегони озброєнь» // Історична інформатика. 2013. № 3. С. 93.

ІСО – Міжнародна організація зі стандартизації. Розробник та видавець міжнародних стандартів. [Електронний ресурс] URL: http://www.iso. org/iso/ru/ (дата звернення: 13.05.2016).

Звіт про науково-дослідну роботу на тему 2.2.4 «Розробка проекту галузевого стандарту створення електронних копій архівних документів», Плану науково-дослідної та дослідно-конструкторської роботи, що виконується на основі державного завдання Федерального архівного агентства на 2014 р. № 89 від 26.1. 2013 (перший етап) «Дослідження та аналіз зарубіжної нормативно-методичної документації, що регулює питання оцифрування архівних документів» / Ю.Ю. Юмашева. М: ВНІІДАД, 2012. С. 84-163. Там же. С. 20.

Об'єднаний електронний архів Івана Буніна. [Електронний ресурс] URL: http://www.bunin-rgali.ru/ (дата звернення: 13.05.2016). Возз'єднаний віртуальний архів Осип Мандельштама. [Електронний ресурс] URL: http://mandelstam-world.info/intro.php (дата звернення: 13.05.2016).

Попов А.В. Російське зарубіжжя та архіви: Документи російської еміграції в архівах Москви: проблеми виявлення, комплектування, опису та використання (Матеріали до історії російської політичної еміграції. Вип. 4). М.: РДГУ, 1998. З. 150-151.

Возз'єднаний віртуальний архів Осип Мандельштама.