Научный журнал
Успехи современного естествознания
ISSN 1681-7494
"Перечень" ВАК
ИФ РИНЦ = 0,736

ИСПОЛЬЗОВАНИЕ ГИСТОГРАММНЫХ ОЦЕНОК В ЗАДАЧАХ РАСПОЗНАВАНИЯ

Современные технологии проектирования информационно-измерительных систем (ИИС) различного назначения все больше ориентируются на повышение степени их «интеллектуальности». Это вызвано стремлением разработчиков упростить эксплуатацию подобных систем, повысить эффективность их функционирования, расширить сферы применения. С другой стороны развитие элементной базы (совершенствование характеристик цифровых сигнальных процессоров, устройств хранения информации, датчиков первичных сигналов и т.п.), позволяет решать в реальном времени всё более сложные в вычислительном отношении задачи. Одной из таких задач, с которыми в той или иной степени сталкивается любая интеллектуальная система, является задача распознавания образов. Базовой операцией в этом случае часто является обнаружение в первичных наблюдаемых сигналах некоторых характерных признаков (элементов, событий), последующая интерпретация которых позволит системе оценить состояние наблюдаемого объекта (сцены) и принять решение о дальнейших действиях.

Природа и характер информативных признаков, используемых при решении задач распознавания, могут быть самыми различными - спектральные плотности эталонных сигналов, автокорреляционные функции, средние значения и т.п. [1]. В том числе достаточно широко используются гистограммные оценки плотностей распределения вероятностей появления значений сигналов, не требующие значительных вычислительных затрат. В зависимости от физической природы сигнала такие оценки могут интерпретироваться по-разному. Например, в системах технического зрения, где в качестве первичного источника информации используются цифровые модели изображений, такие гистограммы характеризуют распределение вероятностей появления пикселей с заданным уровнем яркости, или, в многомерном случае, с заданным цветовым оттенком.

Оценка плотности распределения по гистограмме будет являться случайной величиной, распределение которой должно зависеть от объёма выборки отсчётов сигнала, по которой формируется эта оценка, а также, возможно, от ряда других факторов. Поэтому для принятия решения о целесообразности её использования как информативного признака, необходимо установить вид этого распределения и его основные параметры.

Пусть f -  сигнал, воспринимаемый ИИС, подвергшийся дискретизации и квантованию. Здесь η - Nd - мерный обобщённый аргумент, определяющий положение текущего отсчёта в сигнальной области (пространстве, времени, спектральной зоне и т.п.). Каждый отсчёт может принимать одно из конечного множества значений f, где n - число уровней квантования. Если исходный непрерывный сигнал описывался плотностью распределения f, то дискретная последовательность будет описываться рядом распределения f.

Для вычисления локальной оценки этого ряда в некоторой точке f, выделим в её окрестности область-апертуру заданных размеров и формы, по которой будет вычисляться гистограмма f.

Пусть мощность множества отсчётов сигнала, ограниченных апертурой, равна N. Перенумеруем последовательно рассматриваемые отсчёты: f. Элемент гистограммы hi по определению представляет собой частоту появления отсчётов со значением, равным xi, т.е. f , где f - число отсчётов, равных f .

С ростом N частоты hi сходятся по вероятности к элементам ряда распределения f, однако для любого конечного значения N величины hi будут являться случайными. Для принятия решения о целесообразности использования оценки H в задаче распознавания, необходимо выяснить характер и параметры законов распределения величин hi. Можно показать, что при рассмотрении некоррелированных сигналов, или использовании достаточно больших апертур распределение hi является биномиальным.

Для доказательства рассмотрим процесс формирования величины hi. Анализ j-го отсчёта сигнала является случайным опытом с парой возможных исходов: попадание значения сигнала в i-ый уровень квантования с вероятностью f, и непопадание с вероятностью f. Множество f можно интерпретировать как серию S, состоящую из N опытов принимающую один из 2N возможных исходов с вероятностями:

f

По аналогии с булевыми векторами будем называть весом серии Sik число f, равное числу первых исходов в этой серии.

Разобьём множество возможных исходов серий опытов f на N+1 подмножество - группы серий {Gil}, l=0,K,N, элементы которых имеют равный вес. Вероятность появления любой серии Sik, принадлежащей группе Gil, будет равна f.

Число серий, относящихся к f-ой группе, устанавливается из комбинаторных соображений, и равно числу сочетаний f. Таким образом, суммарная вероятность всех серий, принадлежащих группе f, описывается выражением:

f.

Элемент hi, являющийся частотой появления отсчётов со значением xi, представляет собой дискретную случайную величину, принимающую одно из множества значений f. Вес серии, отнесённый к её длине, имеет размерность частоты появления отсчёта xi, при этом p(Gil) представляет собой ни что иное, как искомый ряд распределения вероятностей f, т.е.

f          (1)

Таким образом, первоначальное утверждение о характере ряда распределения hi справедливо.

В отличие от схемы Бернулли при анализе гистограмм интерес представляют не абсолютные числа положительных исходов, а их относительные частоты f. При этом несколько модифицируются выражения для математического ожидания f и дисперсии f.

В частности можно показать, что математическое ожидание найденного ряда распределения будет равно

f,                   (2)

а дисперсия равна

f.(3)

Зависимости (1-3) позволяют определить диапазон, в который будут попадать оценки плотности распределения f по гистограмме H для заданного объёма выборки и априорных вероятностей появления значений сигнала. На рис. 1 показан пример разброса оценок при нормальном распределенииf .

Таким образом, при ограниченном размере апертуры элементы hi гистограммы будут распределены биномиально, а их математическое ожидание будет равно априорной вероятности появления в сигнале отсчётов со значением xi, т.е. f. Дисперсия элементов hi убывает с ростом объёма выборки N, т.е. увеличение размеров апертуры делает оценку ряда f по гистограмме статистически более обоснованной. Найденные зависимости позволяют определить целесообразность использования гистограммных оценок при решении задачи распознавания.

Литература

  1. Ларкин Е.В., Котов В.В. Особенности идентификации событий методами вейвлет-анализа. // Известия Тульского государственного университета. Серия: Математика. Механика. Информатика. Том 7. Вып. 3. Информатика - Тула: изд-во ТулГУ, 2001. - 200 с. (С. 96-103)

p

Рис. 1. Пример разброса гистограммных оценок при нормальном распределении значений сигнала


Библиографическая ссылка

Котов В.В. ИСПОЛЬЗОВАНИЕ ГИСТОГРАММНЫХ ОЦЕНОК В ЗАДАЧАХ РАСПОЗНАВАНИЯ // Успехи современного естествознания. – 2004. – № 4. – С. 40-42;
URL: http://natural-sciences.ru/ru/article/view?id=12473 (дата обращения: 16.10.2019).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074