ОСОБЕННОСТИ МИКРОФИЛЬМИРОВАНИЯ УГАСАЮЩИХ ДОКУМЕНТОВ

На рис. 1, а показан фрагмент типичного угасающего документа (приведённое изображение было подвергнуто усилению контраста, поскольку, ввиду ограниченности возможностей полиграфии, необработанный оригинал не может быть полноценно воспроизведён). Большинство таких документов содержат текстовую информацию, выполненную различными способами. На рис. 1, б приведены гистограммы распределения уровней серого тона, построенные для выделенных областей изображения. При наличии в пределах анализируемой зоны достаточного числа пикселей, принадлежащих тексту и фону, гистограммы имеют более или менее выраженный бимодальный хаpaктер. Как видно из рисунка, средние уровни яркости текста и фона отличаются незначительно, при этом существует большое количество точек, принадлежащих различным классам, но имеющих одинаковую яркость. Третий фрагмент соответствует чистому фону, и его унимодальная гистограмма приведена для сравнения с первыми двумя.
В процессе микрофильмирования различные по яркости области исходного документа вызывают различные степени почернения плёнки. Связь между величиной экспозиции светочувствительного материала и степенью его почернения описывается хаpaктеристической кривой. С использованием хаpaктеристической кривой, в частности, можно определить коэффициент контрастности γ, равный тангенсу угла наклона линейного участка хаpaктеристической кривой или γ = ΔD / ΔlgH.
С формальной точки зрения процесс химикофотографической обработки можно представить как преобразование глобальной плотности распределения вероятностей появления пикселей той или иной яркости. При нормальном выборе экспозиции (рис. 2, а) граница, разделяющая классы точек текста и фона приходится на линейный участок кривой, (в негативе) текст приходится на нижний участок хаpaктеристической кривой с низким значением γ< 0.2 и становится «прозрачным», а фон - на линейный участок хаpaктеристической кривой с γ > 2.5 и становится «черным». За счёт этого расстояние между пиками гистограммы, а, следовательно, контраст изображения на микрофильме увеличиваются, что обеспечивает повышение общего качества визуального восприятия.
Однако на пpaктике точный выбор экспозиции является сложной задачей. Это вызвано рядом причин. Во-первых, как было указано выше, расстояние между средними яркостями фона и текста невелико, т.е. исходные документы обычно имеют крайне низкий контраст. Поэтому незначительные отклонения в экспозиции ведут либо к существенному недоэкспонированию фотоматериала (рис. 2, б - микрофильмированное изображение документа почти полностью «прозрачное»), либо к его существенному переэкспонированию (рис. 2, в - микрофильмированное изображение почти полностью «черное»). Это влечёт необходимость выполнения многократных пробных съёмок, что очень трудоемко, увеличивает расход материалов и сокращает ресурс оборудования.
Во-вторых, в процессе старения документа изменение его окраски (выцветание чернил, пожелтение бумаги и т.п.) часто происходит неравномерно, так что в разных областях изображения параметры, хаpaктеризующие классы объектов, могут существенно отличаться. В частности разброс средних значений яркости, описывающих текст и фон в пределах одного документа, может оказаться больше, чем полезный интервал экспозиций хаpaктеристической кривой микрофильма (при использовании высококонтрастных фотоматериалов). В результате при непосредственном микрофильмировании оригинала оказывается невозможно подобрать такую экспозицию, которая бы обеспечила приемлемое воспроизведение всех его частей.
В-третьих, в подавляющем большинстве случаев текст оригинала выполняется различными способами (рукописный, машинописный, типографский текст, а также различные печати и штампы), с использованием красителей одного или нескольких цветовых оттенков. Наибольшее сохранность проявляют обычно тексты бланков, выполненные типографским способом. Существенно худшую - рукописные тексты, выполненные чернилами, или машинописные тексты, изготовленные с использованием копировальной бумаги.
На пpaктике обработка изображений осложнена тем, что единственный документ часто содержит текст, выполненный одновременно несколькими способами, с использованием различных красителей - например, типографский бланк, заполненный от руки синими чернилами, на котором стоит резолюция, выполненная красными чернилами, и печать чёрного цвета. Фотоматериал имеет различную чувствительность в различных зонах видимого спектра. Поэтому различные красители при одинаковой экспозиции воспроизводятся на кадре с различной оптической плотностью.
Таким образом, сложно, а зачастую просто невозможно подобрать экспозицию, обеспечивающую нормальное изображение всех элементов оригинала на микрофильме.
Решение описанной задачи можно существенно упростить, перейдя к гибридной технологии, включающей применение компьютера и использующей методы цифровой обработки предварительно сформированного цифрового изображения оригинала. В общем случае цифровую модель изображения I можно представить в виде множества пикселей P :
где x= {x1,...,xNx} - прострaнcтвенные координаты пикселя в поле изображения, с= с1,...,сNс – цветовая координата. В результате обработки формируется изображение I´ = {P´(η)} . Поскольку при микрофильмировании информация о цвете теряется, в обработанном изображении можно рассматривать обобщённый аргумент η состоящим лишь из прострaнcтвенных координат x .
Исходное изображение содержит информацию об объектах, образующих множество классов Ω = {Ωi}, i = 1,...,NΩ, соответствующих различным видам текста и фона. Каждый класс Ωi хаpaктеризуется условной многомерной плотностью распределения вероятностей значений, принимаемых принадлежащими ему пикселями fi (c1,...,cNC), = 1,...,NΩ.
Множество Ω можно представить как совокупность двух непересекающихся подмножеств Ω={Ωt,Ωb} включающих классы, описывающие текст – Ωt и фон – Ωb . Пиксели, относящиеся к разным подмножествам, будут по-разному отображаться в результирующем изображении.
Выходное изображение I´ формируется в результате последовательной обработки каждого пикселя, входящего в исходное изображение I . При этом общую задачу предварительной обработки оригинала можно упростить, рассматривая её как композицию двух подзадач: 1) отнесения каждого пикселя исходного изображения P(η) к одному из классов {Ωi} , и 2) формирования результирующего пикселя P´ (η) с учётом принадлежности его тому или иному классу.
Традиционное применение цветовой сегментации [0] для решения первой подзадачи оказывается малоэффективным, поскольку цветовые и яркостные хаpaктеристики различных классов объектов, из которых состоит изображение угасающего оригинала, отличаются очень незначительно.
Если условные плотности fi (.) каким-либо образом оценены, для решения этой подзадачи можно вычислить условные вероятности принадлежности анализируемого пикселя к каждому из классов {Ωi} . В простейшем случае номер класса, к которому следует отнести пиксель P (η) , можно определить как
В более сложных случаях при расчёте условных вероятностей можно учитывать дополнительную информацию (априорную вероятность появления объектов данного класса в изображении, предполагаемые классы, к которым относятся пиксели из ближайшего окружения и т.п.). Обозначим найденный в соответствии с (2) класс как Ω* .
Экспериментальные исследования угасающих оригиналов показали, что в подавляющем большинстве случаев плотности fi(.) могут быть с достаточной точностью аппроксимированы многомерным нормальным распределением вида:
где – матрица центральных моментов второго порядка, соответствующая оценке распределения f~ i(.):
(ξ1(i), ...,ξ1(i)Nc) – центр i -го распределения; D и cov – дисперсия и ковариация соответственно; .
Элементы матрицы моментов оцениваются непоредственно по обpaбатываемому изображению:
где NSi– число пикселей, образующих зону Si .
Элементы вектора центра распределения представляют собой оценки математических ожиданий величин соответствующих цветовых составляющих изображения в пределах зоны Si , и могут быть вычислены аналогично:
Решение второй подзадачи зависит от принятых допущений относительно вида результирующего изо бражения I´ . В простейшем случае его можно рассматривать как бинарное изображение. При этом если в результате классификации пиксель P (η) оказался отнесённым классу, описывающему текст, то в обработанном изображении соответствующему пикселю P´(η) присваивается некоторое значение Pt . Если рассматриваемый пиксель классифицирован как фон, в результирующем изображении ему присваивается значение Pb>Pt . Величины Pt и Pb выбираются так, чтобы обеспечить формирование микрофильма нормального качества.
Если результирующее изображение I´ рассматривать полутоновым, правило формирования его пикселей можно сформулировать следующим образом: из всех значений выбирается пара максимальных fb – среди чисел, соответствующих классам подмножества Ωb , и ft – среди чисел, соответствующих классам подмножества Ωt . Яркость результирующего пикселя при этом определяется выражением:
где величину α , изменяющуюся от 0 до 1, можно рассматривать как дополнительный параметр, варьируя который человек-оператор может регулировать степень «осветления» результирующего изображения.
На рис. 3 приведён пример изображения, обработанного по описанной методике.
Полученное в результате предварительной обработки изображение может быть непосредственно выведено на микрофильм с использованием COM-системы, либо распечатано на бумажный носитель и микрофильмировано обычным способом.
Литература
- Методы компьютерной обработки изображений. / Под ред. В.А. Сойфера. – М.: Физмат, 2001. – 784 с.
- Фризер Х. Фотографическая регистрация информации. / Пер. с нем. – М.: Мир, 1978. – 670 с.
Рис. 1. Пример угасающего оригинала (а) и соответствующих гистограмм серого тона (б)
Рис. 2. Изменение гистограммы уровней серого в процессе микрофильмирования угасающего оригинала
Рис. 3. Пример обработанного фрагмента угасающего оригинала
12 06 2026 10:42:37
Статья в формате PDF
118 KB...
11 06 2026 7:24:39
Статья в формате PDF
134 KB...
10 06 2026 6:44:40
Статья в формате PDF
127 KB...
09 06 2026 21:26:34
Статья в формате PDF
258 KB...
08 06 2026 11:44:29
Статья в формате PDF
249 KB...
07 06 2026 8:40:23
Статья в формате PDF
214 KB...
06 06 2026 22:20:38
Статья в формате PDF
107 KB...
05 06 2026 16:46:18
Статья в формате PDF
102 KB...
03 06 2026 3:25:20
Статья в формате PDF
379 KB...
02 06 2026 20:14:53
Рассматривается возможность извлечения мелкого золота из золотосодержащего речного песка при проведении очистки фарватера р. Енисей (Тува) земснарядом с производительностью 250 м³/ час по исходным пескам, и убедительно показана целесообразность и экономическая выгода этого.
...
01 06 2026 7:18:39
31 05 2026 13:49:35
Статья в формате PDF
103 KB...
30 05 2026 5:42:45
Статья в формате PDF
245 KB...
28 05 2026 15:29:17
27 05 2026 14:52:27
Статья в формате PDF
209 KB...
26 05 2026 14:21:45
Статья в формате PDF
207 KB...
25 05 2026 16:37:26
Статья в формате PDF
269 KB...
24 05 2026 11:43:41
Статья в формате PDF
107 KB...
23 05 2026 7:48:56
Статья в формате PDF
275 KB...
21 05 2026 20:43:57
Статья в формате PDF
133 KB...
20 05 2026 13:15:27
Статья в формате PDF
107 KB...
19 05 2026 6:31:12
Статья в формате PDF
113 KB...
18 05 2026 0:40:12
Статья в формате PDF
101 KB...
17 05 2026 12:15:14
Статья в формате PDF
102 KB...
16 05 2026 17:58:44
Статья в формате PDF
250 KB...
15 05 2026 22:50:58
Статья в формате PDF
117 KB...
14 05 2026 6:21:10
Статья в формате PDF
156 KB...
13 05 2026 19:32:53
Среди населения Муганской зоны Азербайджана проведены медико-генетические исследования по выявлению нарушений ЦНС и органов чувств, установлены типы наследования патологий. Путем цитогенетического анализа идентифицированы кариотипы больных синдромом Клайнфельтера. Среди 352 больных с 21 наследственными и врожденными заболеваниями большая часть приходится на моногенные патологии с аутосомно-рецессивным типом наследования, что объясняется кровнородственными бpaками среди родителей пробандов.
...
12 05 2026 21:24:39
В статье исследованы некоторые проблемы опережающего антикризисного управления предприятием.
...
11 05 2026 0:38:14
Статья в формате PDF
116 KB...
10 05 2026 20:55:32
Статья в формате PDF
102 KB...
09 05 2026 1:36:40
Статья в формате PDF
150 KB...
08 05 2026 8:54:34
Статья в формате PDF
286 KB...
07 05 2026 0:57:13
Статья в формате PDF
100 KB...
06 05 2026 0:45:17
Статья в формате PDF
113 KB...
05 05 2026 0:54:59
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::