РОССИЙСКИЙ НАУЧНЫЙ ЭЛЕКТРОННЫЙ ЖУРНАЛ Электронные библиотеки
2002 | Том 5 | Выпуск 3

Оцифровка - метод сохранения?

Александр Гешке

Центр по сохранению книги, Лейпциг, Германия


Вступление

Центр по сохранению книги в Лейпциге является частным реставрационным центром, который предоставляет свои услуги библиотекам, архивам и музеям. ЦФБ образовался из Отдела реставрации Немецкой библиотеки Лейпцига, который по инициативе сотрудников в 1997 г. превратился в Общество с ограниченной ответственностью.

Обрабатываемые объекты включают в себя, газеты и архивные материалы, вплоть до карт и графики. Круг клиентов складывается из национальных и международных организаций, но включает в себя также и более мелкие местные архивы и библиотеки, а также частных клиентов.

Своим современным имиджем мирного ведущего Центра по сохранению фондов библиотек и архивов ЦФБ обязано современнейшей технике. Многолетняя работа по исследованиям и развитию, которая начала 20 лет тому назад в Лейпциге, привела к тщательной обработке даже очень сильно поврежденных бумаг. Усилия в области исследования и развития после приватизации были продолжены еще более интенсивно. В результате для стабилизации сильно поврежденной бумаги, для мокрой обработки средних повреждений, для массовой нейтрализации и некоторых частичных операций в распоряжении имеются методы, которые дают возможность обрабатывать большие количества материалов. Эти методы обеспечивают спасение большого объема культурного наследия при сравнительно малых затратах. Философия ЦФБ является философией оказания полного комплекса услуг при небольшой стоимости и массовой и индивидуальной обработке материалов.

Дополнительно предлагается изготовление вторичных форм. ЦФБ предлагает три различных способа: высокого качества микрофильмирование как выгодный по цене вариант по сохранению содержания, оцифровка для обеспечения быстрого доступа к соответствующему документу для многих пользователей и изготовление цифровых копий, которые мы предлагаем как не изменяющуюся со временем книжную форму.

Я хочу вам представить практические проблемы оцифровки, с которыми столкнулись многие проекты во всём мире.

2. Описание ситуации

2.1. Вступление

Уже в 1996 году Маргаред Хедстром [i] из университета Мичиган в США написала поэтому поводу интересную статью «Дигитальное сохранение: Временная бомба для электронных библиотек». Сразу чувствуется, что можно спорить. Но как правильно!

Вначале определение - Конвай писал в 1990 году, что главной целью является сохранение информации и обеспечение доступа к ней.

Если мы согласимся этим тезисом, то уже более спокойно может обсуждать проблемы.

В упомянутой статье говорится, что запоминающие устройства сверхбольшой ёмкости и долговечность информации сегодня ещё противоречат друг другу.

Мы в состоянии запомнить большие массивы данных, но вряд ли на большой срок. Единственный выход сегодня: сохранение цифровых данных должно быть дополнено копированием, потому что долговечность хранения информации зависит не только от физического носителя (магнитный диск, лента, CD-ROM и т.д.), но и от быстро меняющихся технологий (программное обеспечение и компьютеры).

В конце статьи подчеркивает существенный недостаток оцифровки, которой и сегодня, через 5 лет после написания статьи, представляется не менее существенным: отсутствие глубокого и дружественного диалога между кураторами коллекций и технологами.

В другой работе (Вебер/Доерр [ii] ) Немецкого исследовательского Общество (ДФГ), занимающегося оцифровкой для архивов и библиотек, на главной вопрос «микрофильм или оцифровка?» дается ответ „обе технологии“.

В третьей публикации рассматриваются результаты двух проектов Европейского Сообщества (Проекты "EVA“  „SEPIA“). Авторы Клиин и Лузенет [iii]    в докладе 2000 года в первый раз приводят статистику по этому вопросу, которая показывает, что несмотря на теоретические дискуссии, практики начали работать. И если иметь в виду, что бумага часто просто исчезает, то времени для вечных дискуссии просто нет.

Несмотря на то, что названный доклад рассматривает вопросы оцифровки фотоархивов, он даёт ценную информацию для решения общей проблемы оцифровки как средства сохранения фондов.

Была исследована 141 коллекция фотографий в 29 европейских странах, которые составляют вместе почти 120 миллионов фотографий. Самые мелкие коллекции состоят всего лишь из 700 фотографии, а самая большая - из 12 миллионов.

2.1.1. Какие учреждения имеют фотоколлекции (архив, библиотека, музей)?

Рисунок 1: Тип учреждения.

2.1.2. Какие фотографические материалы используются? (многократные ответы / макс. число для одного материала - 141)

Рисунок 2: Тип фотографического материала

2.1.3. Каковы цели обращения к фотофондам? (многократные ответы, макс. число ответов 141).

Научные исследования - 92; коммерческие -24; личные -29

2.1.4. Возраст фотографии

Рисунок 3: Возраст фотографии

2.1.5. Используется ли стандартное описание фотографий (макс. число 141)
да:    70 / по ISO, ANIS/  ICA, IFLA, ICOM/
нет:  50
специальное, частично дополненное описание: 33

2.1.6. Какие СУБД (программное обеспечение) используются?

Рисунок 4. Используемые СУБД

2.1.7. Каковы причины для оцифровки?

Рисунок 5. Причины оцифровки (другие, повышенный спрос, доступ по интернету, поиск по изображениям, защита ценных оригиналов)

2.1.8. Как проводили оцифровку (в процентах от 141)

Экстренно в фирме 22

В своём учреждении (частично с помощью фирм): 65

Оба варианта вместе:12

2.1.9. Какие цифровые форматы использовались?
(процент ответов /макс. 141)

Рисунок 6: Форматы изображения

2.1.10. Производилась ли обработка изображений?
Да: 56  Нет: 43

2.1.1. Используются ли для описания изображений метаданные ?
Нет: 77    Да: 23

2.1.12. Был ли проект документирован?
Нет: 56   Да: 44

2.1.13. На каком носителе хранится информация?
 

Рисунок 7: Носитель информации (CD-ROM, сеть, ZIP, PCD)

2.1.14. Какую форму копии получает заказчик?

фотография: 75
цифровой дубликат: 4
и то, и другое: 21

Советы для практической оцифровки

В январе 1999 Государственная Библиотека в Вашингтоне опубликовала доклад по оцифровке . ползуясь этим докладом и личным опытом хочу подчеркнуть те моменты, которые особенно важны при проведении проектов оцифровки.

Причины для оцифровки

Является ли первичной причиной для оцифровки сохранение информации (фотографий) и/ или доступ к ней? Оцифровка может не только повысить, но и уменьшить спрос на оригиналы.

Выбор фотографии или групп фотографий для оцифровки.

По критериям доступа:

  • чтобы объединить фотографии, которые обычно хранятся в разных местах;
  • чтобы обеспечить доступ в тех случаях, когда доступ к оригиналу временно запрещен;
  • реализовать более лёгкий доступ (найти фотографию);
  • обеспечить более лёгкое распространение копии.

Для более полного удовлетворения потребностей пользователя:

  • чтобы представить информацию в виде, более удобном для потребителя
  • чтобы лучше узнать потребности пользователя
  • чтобы узнать приоритетный способ распространения информации (интернет, СД-РОМ, фотокопия).

По внутренним причинам:
Цветные фотографии по сравнению с черно-белым фотографиями предъявляют более высокие требования к памяти. Разница в цене для групп фотоносителей (стеклянный негатив, фильмнегатив, диапозитив, печать и т.п.).

Что сканировать - оригинал или копию?

Вторичные проблемы, которые надо иметь в виду:

  • Юридические вопросы - собственность и права (т.к. учрежедение в случае распространения информации является «издательством».
  • Если учреждение имеет в своей коллекции фотографии – это ещё не значит, что оно имеет право для производства цифровых документов и их распределение.
  • Каждый проект имеет организационные аспекты (например, если фотографии лежат в подвале, а сканер находится на чердаке, то необходимо обеспечить транспортировку и маркирование). Затраты времени и связанная с этим рационализация всех процессов, особенно самой оцифровки.
Планирование оцифровки

Определение объектов оцифровки (отношение числа отдельных типов фотографии, таких как цветные или черно-белые негативы, диапозитивы, оттиски и т.д., а также по геометрическим размерам).

Надо ли производить дополнительную копию (аналоговую фотографию, микрофильмы, печать).

Какова средство для распространения /продажи (Интернет, CD-ROM, DVD, фильм)

Поручать оцифровку фирмам на их площадках или самостоятельная оцифровка

В зависимости от требуемых финансовых затрат которые, в своею очередь, зависят от количества оцифрованных объектов. фирмы могут производить оцифровку на своих площадках или в учреждении заказчика.

Затраты для самостоятельной оцифровки включают в себя не только заработную плату, но и покупку техники и программного обеспечения для оцифровки (сканер, компьютер и т.п.), а также обычно и повышения квалификации соответствующих сотрудников.

Оцифровка

Сама оцифровка требует порядка 50% проектных средств. Вторым главным фактором проекта является индексирование. Для больших коллекции оцифровка в самом учреждении помощью обслуживающей фирмы часто выгоднее, потому что можно обойтись без движения оригиналов.

Качество изображения

Как главные подтемы к этому вопросу относятся:

  • Используемые стандарты для запоминания изображения (включая вид сжатия данных)
  • Ограничение размеров изображений (в связи с видом воспроизведения - монитор, печать, интернет)
Обработка изображений

Многократное представление (например: минимальное разрешение 128 х 128 пиксел, среднее 600 x 800, высокое 2000х2000 пиксел.)

Индексирование

Затраты сильно колеблются в зависимости от вида объектов и запросов.
индексирование можно проводить после оцифровки. В этом случае объединяются данные по изображению и данные для запроса. использование поиска и соответствующих стандартов исключительно важно для дальнейшего использования цифрового фотоархива.

Дополнительной проблемой являются метаданные и вопрос внутренней (в своей организации) или внешней (силами специализированной фирмы) индексации.

Потребности в вычислительной технике

Запоминающие устройства/оборудование

Если репродукции среднего качества формата 20 x 30 см требуют разрешения 1500х2000 пиксел, то для несжатого цветного изображения понадобится 9мБ памяти, т.е. для 10 000 фотографии нужны 90 ТБ памяти (или 150 CD-ROM). Как пример можно привести 3 млн. фотографий среднего разрешения вашингтонского Государственного отдела Работы и Промышленности:

Даже при сильном сжатии данных требуется 700 ТБ. Это обеспечили CD-ROM-„Джугбоксами“, что довольно сложно и дорого.

С другой стороны архивы, которые имеют меньше 50 000 фотографий, можно и сегодня организовать хранение информации сравнительно благоприятно.

Индексирование/создание банка данных для обработки изображений
Эту задачу можно выполнить на обычном компьютере.

Требование к программному обеспечению

Для сканера и для создания CD-ROM можно использовать коммерческие  продукты, если надо обработать меньше, чем 20 000 фотографий.
Если больше, то выгоднее использовать так называемое предикционное матобеспечение.

Копирование/ печать

Интернет

Консультации

Независимо от того, используются внешние фирмы или оцифровка производится самостоятельно, целесообразно иметь внешнего консультанта для организации всего проекта. Затраты на консультанта скоро будут покрыты более совершенными результатами работы и оптимальной настройки рабочего коллектива на потребности общения.

Проектирование роста системы

Для определения мощности системы, кроме данных по фотоколлекциям, надо имеет в виду также потенциальной рост в будущем. К этому относятся решения по оцифровке в дальнейшем новых объектов, а также по включению дополнительных процессов, например, редактирование данных.

Учёт старения

При каждом вложением капитала для самостоятельной оцифровки надо иметь в виду, что техника и матобеспечение скоро стареют. Это дополнительный аргумент в пользу внешней оцифровки.

Стратегия перемещения / миграции данных
Переход от проектной к операционной работе
Документация проекта

Литература

[i] Margared Hedstrom, Digital preservation: a time bomb for Digital Libraries, University of Michigan, School of Information and Library Studies in: http://www.uky.edu/~kiernan/DL/hedstrom.html (1996)

[ii] Hartmut Weber, Marianne Dörr, Digitisation as a Method of Preservation? Final DFG-Report, July 1997, ECPA, Amsterdam /CPA, Washington in: http://www.knaw.nl/ecpa/publ/weber.html

[iii] Klijn und de Lusenet, In the Picture /Preservation and digitisation of European photographic collections, ESPA, Amsterdam, 2000 from: http://www.knaw.nl/ecpa/ecpatex/public.htm#ecpa

[iv] Issues in Digitization: A Report Prepared for the Washington State Library Council, Jan. 1999 aus : http://www.statelib.wa.gov/projects/Digitize/Digitization10.html


Об авторе

Александр Гешке (Alexander Geschke) - ZFB Zentrum fur Bucherhaltung, Deutschland, Центр по сохранению книги, Лейпциг, Mommsen-Str.7, 04329-Leipzig, Германия.
e-mail: geschke@zfb.com

©  Alexander Geschke, 2002
Последнее обновление страницы было произведено: 2003-12-09

Все предложения и пожелания по содержанию и структуре портала направляйте по адресу rdlp@iis.ru