Научный журнал
Успехи современного естествознания
ISSN 1681-7494
"Перечень" ВАК
ИФ РИНЦ = 0,653

ОСОБЕННОСТИ МИКРОФИЛЬМИРОВАНИЯ УГАСАЮЩИХ ДОКУМЕНТОВ

Бобылев Л.И. Гаврилин А.П. Данилкин Ф.А. Котов В.В.
В статье рассматривается вопрос долговременного архивного хранения угасающих документов. Проанализированы сложности, возникающие при их микрофильмировании. Предложена методика предварительной компьютерной обработки сканированных изображений таких документов, обеспечивающая повышение качества их визуального восприятия до требований государственного стандарта к микрофильмируемым оригиналам. Обработанные изображения в дальнейшем могут быть выведены на фотоплёнку с использованием COM-систем (Computer Output Microfilm), либо распечатаны на бумажный носитель и микрофильмированы обычным способом.
К угасающим относятся архивные документы, физическое состояние или контраст изображения которых в силу длительного хранения не удовлетворяют требованиям ГОСТ 13.1.002. «Репрография. Микрография. Документы для съемки. Общие требования и нормы». Непосредственное их микрофильмирование [0] сопряжено со значительными сложностями, на которых следует остановиться более подробно.

На рис. 1, а показан фрагмент типичного угасающего документа (приведённое изображение было подвергнуто усилению контраста, поскольку, ввиду ограниченности возможностей полиграфии, необработанный оригинал не может быть полноценно воспроизведён). Большинство таких документов содержат текстовую информацию, выполненную различными способами. На рис. 1, б приведены гистограммы распределения уровней серого тона, построенные для выделенных областей изображения. При наличии в пределах анализируемой зоны достаточного числа пикселей, принадлежащих тексту и фону, гистограммы имеют более или менее выраженный бимодальный характер. Как видно из рисунка, средние уровни яркости текста и фона отличаются незначительно, при этом существует большое количество точек, принадлежащих различным классам, но имеющих одинаковую яркость. Третий фрагмент соответствует чистому фону, и его унимодальная гистограмма приведена для сравнения с первыми двумя.

В процессе микрофильмирования различные по яркости области исходного документа вызывают различные степени почернения плёнки. Связь между величиной экспозиции светочувствительного материала и степенью его почернения описывается характеристической кривой. С использованием характеристической кривой, в частности, можно определить коэффициент контрастности γ, равный тангенсу угла наклона линейного участка характеристической кривой или γ = ΔD / ΔlgH.

С формальной точки зрения процесс химикофотографической обработки можно представить как преобразование глобальной плотности распределения вероятностей появления пикселей той или иной яркости. При нормальном выборе экспозиции (рис. 2, а) граница, разделяющая классы точек текста и фона приходится на линейный участок кривой, (в негативе) текст приходится на нижний участок характеристической кривой с низким значением  γ< 0.2 и становится «прозрачным», а фон - на линейный участок характеристической кривой с γ > 2.5 и становится «черным». За счёт этого расстояние между пиками гистограммы, а, следовательно, контраст изображения на микрофильме увеличиваются, что обеспечивает повышение общего качества визуального восприятия.

Однако на практике точный выбор экспозиции является сложной задачей. Это вызвано рядом причин. Во-первых, как было указано выше, расстояние между средними яркостями фона и текста невелико, т.е. исходные документы обычно имеют крайне низкий контраст. Поэтому незначительные отклонения в экспозиции ведут либо к существенному недоэкспонированию фотоматериала (рис. 2, б - микрофильмированное изображение документа почти полностью «прозрачное»), либо к его существенному переэкспонированию (рис. 2, в - микрофильмированное изображение почти полностью «черное»). Это влечёт необходимость выполнения многократных пробных съёмок, что очень трудоемко, увеличивает расход материалов и сокращает ресурс оборудования.

Во-вторых, в процессе старения документа изменение его окраски (выцветание чернил, пожелтение бумаги и т.п.) часто происходит неравномерно, так что в разных областях изображения параметры, характеризующие классы объектов, могут существенно отличаться. В частности разброс средних значений яркости, описывающих текст и фон в пределах одного документа, может оказаться больше, чем полезный интервал экспозиций характеристической кривой микрофильма (при использовании высококонтрастных фотоматериалов). В результате при непосредственном микрофильмировании оригинала оказывается невозможно подобрать такую экспозицию, которая бы обеспечила приемлемое воспроизведение всех его частей.

В-третьих, в подавляющем большинстве случаев текст оригинала выполняется различными способами (рукописный, машинописный, типографский текст, а также различные печати и штампы), с использованием красителей одного или нескольких цветовых оттенков. Наибольшее сохранность проявляют обычно тексты бланков, выполненные типографским способом. Существенно худшую - рукописные тексты, выполненные чернилами, или машинописные тексты, изготовленные с использованием копировальной бумаги.

На практике обработка изображений осложнена тем, что единственный документ часто содержит текст, выполненный одновременно несколькими способами, с использованием различных красителей - например, типографский бланк, заполненный от руки синими чернилами, на котором стоит резолюция, выполненная красными чернилами, и печать чёрного цвета. Фотоматериал имеет различную чувствительность в различных зонах видимого спектра. Поэтому различные красители при одинаковой экспозиции воспроизводятся на кадре с различной оптической плотностью.

Таким образом, сложно, а зачастую просто невозможно подобрать экспозицию, обеспечивающую нормальное изображение всех элементов оригинала на микрофильме.

Решение описанной задачи можно существенно упростить, перейдя к гибридной технологии, включающей применение компьютера и использующей методы цифровой обработки предварительно сформированного цифрового изображения оригинала. В общем случае цифровую модель изображения I можно представить в виде множества пикселей P :

где x= {x1,...,xNx} - пространственные координаты пикселя в поле изображения, с= с1,...,с – цветовая координата. В результате обработки формируется изображение I´ = {P´(η)} . Поскольку при микрофильмировании информация о цвете теряется, в обработанном изображении можно рассматривать обобщённый аргумент η состоящим лишь из пространственных координат x .

Исходное изображение содержит информацию об объектах, образующих множество классов Ω = {Ωi}, i = 1,...,NΩ, соответствующих различным видам текста и фона. Каждый класс Ωi характеризуется условной многомерной плотностью распределения вероятностей значений, принимаемых принадлежащими ему пикселями fi (c1,...,cNC), = 1,...,NΩ.

Множество Ω можно представить как совокупность двух непересекающихся подмножеств Ω={Ωtb} включающих классы, описывающие текст – Ωt и фон – Ωb . Пиксели, относящиеся к разным подмножествам, будут по-разному отображаться в результирующем изображении.

Выходное изображение I´ формируется в результате последовательной обработки каждого пикселя, входящего в исходное изображение I . При этом общую задачу предварительной обработки оригинала можно упростить, рассматривая её как композицию двух подзадач: 1) отнесения каждого пикселя исходного изображения P(η) к одному из классов {Ωi} , и 2) формирования результирующего пикселя P´ (η) с учётом принадлежности его тому или иному классу.

Традиционное применение цветовой сегментации [0] для решения первой подзадачи оказывается малоэффективным, поскольку цветовые и яркостные характеристики различных классов объектов, из которых состоит изображение угасающего оригинала, отличаются очень незначительно.

Если условные плотности fi (.) каким-либо образом оценены, для решения этой подзадачи можно вычислить условные вероятности принадлежности анализируемого пикселя к каждому из классов {Ωi} . В простейшем случае номер класса, к которому следует отнести пиксель  P (η) , можно определить как

В более сложных случаях при расчёте условных вероятностей можно учитывать дополнительную информацию (априорную вероятность появления объектов данного класса в изображении, предполагаемые классы, к которым относятся пиксели из ближайшего окружения и т.п.). Обозначим найденный в соответствии с (2) класс как Ω* .

Экспериментальные исследования угасающих оригиналов показали, что в подавляющем большинстве случаев плотности fi(.) могут быть с достаточной точностью аппроксимированы многомерным нормальным распределением вида:

где   – матрица центральных моментов второго порядка, соответствующая оценке распределения f~ i(.):

1(i), ...,ξ1(i)Nc) – центр i -го распределения; D и cov – дисперсия и ковариация соответственно; .

Элементы матрицы моментов оцениваются непоредственно по обрабатываемому изображению:

где NSi– число пикселей, образующих зону Si .

Элементы вектора центра распределения представляют собой оценки математических ожиданий величин соответствующих цветовых составляющих изображения в пределах зоны Si , и могут быть вычислены аналогично:

Решение второй подзадачи зависит от принятых допущений относительно вида результирующего изо бражения I´ . В простейшем случае его можно рассматривать как бинарное изображение. При этом если в результате классификации пиксель P (η) оказался отнесённым классу, описывающему текст, то в обработанном изображении соответствующему пикселю P´(η) присваивается некоторое значение Pt . Если рассматриваемый пиксель классифицирован как фон, в результирующем изображении ему присваивается значение Pb>Pt . Величины Pt и Pb выбираются так, чтобы обеспечить формирование микрофильма нормального качества.

Если результирующее изображение I´ рассматривать полутоновым, правило формирования его пикселей можно сформулировать следующим образом: из всех значений выбирается пара максимальных fb – среди чисел, соответствующих классам подмножества Ωb , и ft – среди чисел, соответствующих классам подмножества Ωt . Яркость результирующего пикселя при этом определяется выражением:

где величину α , изменяющуюся от 0 до 1, можно рассматривать как дополнительный параметр, варьируя который человек-оператор может регулировать степень «осветления» результирующего изображения.

На рис. 3 приведён пример изображения, обработанного по описанной методике.

Полученное в результате предварительной обработки изображение может быть непосредственно выведено на микрофильм с использованием COM-системы, либо распечатано на бумажный носитель и микрофильмировано обычным способом.

Литература

  • Методы компьютерной обработки изображений. / Под ред. В.А. Сойфера. – М.: Физмат, 2001. – 784 с.
  • Фризер Х. Фотографическая регистрация информации. / Пер. с нем. – М.: Мир, 1978. – 670 с.

Рис. 1. Пример угасающего оригинала (а) и соответствующих гистограмм серого тона (б)

Рис. 2. Изменение гистограммы уровней серого в процессе микрофильмирования угасающего оригинала

Рис. 3. Пример обработанного фрагмента угасающего оригинала


Библиографическая ссылка

Бобылев Л.И., Гаврилин А.П., Данилкин Ф.А., Котов В.В. ОСОБЕННОСТИ МИКРОФИЛЬМИРОВАНИЯ УГАСАЮЩИХ ДОКУМЕНТОВ // Успехи современного естествознания. – 2003. – № 12. – С. 28-31;
URL: http://natural-sciences.ru/ru/article/view?id=15501 (дата обращения: 21.05.2019).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.252