Поиски месторождений полезных ископаемых – многоэтапный процесс, начинающийся с региональных исследований и завершающийся поисково-разведочными работами. Задача каждого из этапов поисков – выбор площадей под более детальные работы следующего этапа. Прогнозирование – особая стадия исследований, завершающая каждый из этапов. Это процесс обоснования указанного выбора на основе имеющейся информации, полученной главным образом на данном этапе. Следовательно, прогнозирование является чрезвычайно ответственной, ключевой стадией, в значительной мере определяющей эффективность всего геологоразведочного процесса. В то же время это и весьма сложный вид исследований, в котором по каждому из возникающих вопросов обычно имеются конкурирующие альтернативы. Поэтому на совершенствование методики прогнозирования с целью коренного улучшения качества прогнозных построений направлены усилия многих научных коллективов. Сложность же проблемы заключается в том, что районирование территории по степени перспективности обнаружения того или иного полезного ископаемого необходимо оценивать по косвенным признакам, связь которых с целевым признаком должна иметь теоретическое обоснование.
Основу практически всех геологических построений, теорий и гипотез традиционно составляют различные карты: геологические, геофизические, геохимические, многие другие. История использования карт в науках о Земле уходит вглубь веков. По мнению В.В.Марченко [8], это обусловлено свойством, присущим самой карте, как наиболее адекватной модели действительности, отражающей реальные процессы, происходящие как на поверхности Земли, так и в ее глубинах. Анализ карт стал одним из ведущих научно-исследовательских методов. Важным свойством карты, как носителя информации, является принцип абстрагирования, т.е. возможность при создании карты выделять главное, существенное, очищенное от второстепенных деталей и аккумулирующее в себе черты, присущие родственным явлениям, при отображении тех или иных физико-геологических процессов. Такие абстрактные картографические модели, необходимые для разработки принципов и методик исследований, дают возможность изучать явление как бы в чистом, не затушеванном другими причинами виде. Другим важным свойством карты является ее информационная емкость, по объему превосходящая почти все другие способы передачи информации, хотя карта не решает проблему получения точных количественных оценок. Достоинством карты является ее обзорность, способность представлять в наглядной форме то, что скрыто от непосредственного наблюдения. Карта выступает в двойной форме: в качестве средства исследования и как его предмет в виде модели, т.е., с одной стороны, карта способствует выдвижению научных гипотез, а с другой – отображает разного рода априорные схемы и модели в наглядной картографической форме.
Наибольшее распространение в изучении природы на основе карт получил картографический метод. «Картографический метод исследования – это метод использования карт для познания отраженных на них явлений. Познание включает получение по картам качественных сведений и количественных характеристик явлений и процессов, изучение взаимосвязей и взаимозависимостей в геосистемах, их динамики и эволюции во времени и в пространстве, установление тенденций развития и прогноз будущих состояний геосистем» [2]. Этот метод применим на любых уровнях исследований: от систематизации исходных материалов до системно-структурного анализа, создания пространственных математических моделей.
Данная работа посвящена технологии и методам геоинформационного анализа, алгоритмам и технологии ввода картографической информации и технологии перехода от картографических данных и формализованных знаний к картам апостериорной вероятности обнаружения целевых объектов на основе применения программного комплекса GIA (Геоинформационный анализ).
Программный комплекс GIA
Программный комплекс GIA, разработанный под руководством доктора технических наук, профессора В.В. Ломтадзе, предназначается для решения широкого круга задач обработки и анализа геолого-геофизической информации. GIA включает в себя «оболочку» и функциональные программные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных. Оболочка построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированность и унифицированный графический интерфейс пользователя [7]. Набор функциональных модулей может расширяться с одновременным включением в оболочку новых пунктов меню. Такая структура программного комплекса, а также ориентация на хранение исходных данных в реляционной базе данных позволяют оперативно конфигурировать GIA для решения конкретного круга задач.
В настоящее время GIA включает в себя программные средства для создания (или выбора ранее созданной) базы данных, для ввода в эту базу картографической информации и массовых геофизических данных по конкретной площади, для разделения полей, их интерполяции и построения карт с нанесением на них выбранных картографических объектов, для статистического анализа данных (одномерный, факторный, корреляционно-регрессионный) и прогнозирования геологических объектов и явлений (системно-модельный подход и метод аналогий). Рисунок иллюстрирует состав программного комплекса, а также процедуру выбора площади работ и базы данных. Ввиду эффективности применяемых методов интерполяции данных возможно включение в комплекс технологий подсчета запасов некоторых видов полезных ископаемых. После пункта меню ПО-общее (общее программное обеспечение) могут быть добавлены новые пункты меню. Для использования GIA необходим компьютер с операционной системой Windows. Карты строятся на любом струйном принтере или плоттере, если он поддерживается ОС Windows. Комплекс ориентирован на применение локальной СУБД Access [6]. Вся информация о работе функциональных модулей (протокол исполнения графов обработки данных) выводится в текстовый файл, который средствами GIA может преобразовываться в документ Word.
Иллюстрация состава программного комплекса GIA и процедуры его использования
Обработка и анализ полей геолого-геофизических признаков
Возможности программного продукта GIA можно проиллюстрировать на примере обработки и анализа полей геолого-геофизических признаков с использованием методов интерполяции и разделения полей. Интерполяция часто применяется для того, чтобы по измеренным в разных точках площади значениям различных геолого-геофизических признаков рассчитать их значения в узлах одной и той же сети – обычно квадратной. В результате применения алгоритмов интерполяции и разделения полей каждый узел сети становится охарактеризованным значениями геолого-геофизических полей или значениями их региональных и локальных составляющих. Тем самым формируется признаковое пространство – каждый объект в этом пространстве представляет собой точку, координатами которой являются значения изучаемых признаков. Образное мысленное представление признакового пространства позволяет лучше понять смысл статистического анализа данных, в особенности многомерного статистического анализа.
В основе алгоритмов интерполяции и разделения полей лежат модельные представления. Чаще всего изучаемое поле рассматривается как сумма трех составляющих. Этими составляющими являются:
– поле целевых объектов (f1), т.е. представляющих практический интерес, – поле модели;
– региональный фон (f0) – поле объектов, которые в значительной степени (на порядок или более) превосходят целевые объекты по глубине залегания и (или) размерам;
– помеха (f2) – поле неоднородностей среды, не учитываемых первыми двумя составляющими, и ошибки наблюдений.
Часто рассматривают только две составляющие: поле модели (детерминированную компоненту) и помеху (случайную компоненту поля). В этом случае поле модели включает в себя региональный фон или предполагается его постоянство в пределах площади анализа данных.
В программный комплекс GIA включены два метода интерполяции и только один метод разделения полей. Формальные пересчеты поля вверх, вниз и т.п. (типа свертки матрицы значений поля в скользящем окне с матрицей постоянных коэффициентов), применявшиеся в первые десятилетия после появления электронных вычислительных машин, в этой работе не рассматриваются. Результаты таких преобразований сильно зависят от случайной компоненты поля, от рельефа, на котором задано поле, требуют использования большого скользящего окна. Эти результаты трудны для геологического истолкования. Более понятны такие приемы, как осреднение без учета «аномальных» точек или итерационное осреднение, при котором на каждой итерации уменьшается вес аномальных точек – тех, в которых велико отклонение осредненного поля от исходного. Именно итерационное осреднение и включено в комплекс GIA. Задав радиус скользящего окна R так, чтобы он превышал радиус локальных целевых аномалий примерно в три-четыре раза, этим способом можно надежно «подавить» локальные аномалии, не «размазывая» их в пределах скользящего окна, как при обычном осреднении или при пересчетах поля вверх. Остаточное поле в этом случае контрастно отображает локальные аномалии, вызываемые объектами, представляющими практический интерес.
Алгоритмы интерполяции, применяемые в GIA, также тщательно отобраны – как на основе теоретических обоснований, так и на основе многолетнего практического опыта обработки массовых геоданных. Первый из этих алгоритмов основан на аппроксимации поля гармоническими функциями (полем точечных источников). Этот способ представляет собой технологическое развитие идей В.И. Аронова [1]. Второй включенный в GIA алгоритм интерполяции основан на анализе ситуации в окрестности каждого узла интерполяции, а также на применении кусочно-полиномиальной аппроксимации и статистической теории интерпретации [4]. Ниже дано описание некоторых особенностей первого из упомянутых двух алгоритмов, включенный в GIA.
Особенность способа в том, что аномалии в исходном поле аппроксимируются полем точечных источников, и можно задать допустимое отклонение E интерполированного поля от поля в исходных точках. В GIA принимается E = DC/5, где DC – желаемое сечение изолиний на карте интерполируемого признака. Этот алгоритм особенно эффективен, когда количество исходных точек измеряется десятками (например, это скважины) или сотнями, и требуется, чтобы значения интерполированного поля (изолинии) были бы близки (не сглажены сильно) к значениям в исходных точках. Поясним алгоритм подробнее:
1. Региональный фон (тренд) аппроксимируется плоским полем
F = aX + bY + c,
или же параболическим
F = a20•X•X + a11•X•Y + a02•Y•Y + a10•X + a01•Y + a00,
которое вычитается из исходного поля. Коэффициенты тренда находятся из системы условных уравнений и запоминаются программой. Так, при аппроксимации фона плоским полем система условных уравнений имеет вид
Fi = aXi + bYi + c, i = 1,…, M,
где M – число точек на площади.
Аналогично строится система условных уравнений при аппроксимации регионального фона параболическим трендом. Такие уравнения называют условными, т.к. их, как правило, нельзя превратить в тождества подбором искомых коэффициентов; можно только минимизировать невязки между левой и правой частями уравнений. Чаще всего для поиска параметров модели (здесь – коэффициентов тренда) используется метод наименьших квадратов. В рассматриваемой программе коэффициенты тренда также отыскиваются путем минимизации суммы квадратов невязок условных уравнений.
2. Далее программа среди всех исходных точек отыскивает точку A с максимальным по модулю значением FA аппроксимируемого поля и выполняет оконтуривание аномалии с максимумом в точке A. Для оконтуривания рассматриваются точки в 16 секторах вокруг точки A. Для каждого сектора выбираются и упорядочиваются по уменьшению абсолютного значения поля до 50 точек, ближайших к точке A. Одновременно находится радиус аномалии в секторе. Затем вычисляется средний (по секторам) радиус аномалии RA, минимальный радиус RMIN, и на глубине H0 = RA/2 размещаются точечные массы под точками, в которых значение поля равно или превышает FA/2. Массы источников (точнее, их интенсивности, пропорциональные массам) находятся симплекс-методом [5]. Затем глубина H0 варьируется в интервале от RA/2 до RMIN/2, и находится ее значение, при котором минимальна сумма модулей невязок модельного и исходного полей. Поле найденных источников вычитается из исходного поля и вновь выполняется поиск наибольшей по модулю аномалии FA.
3. Процесс аппроксимации заканчивается, если FA < E или если число уже аппроксимированных аномалий достигло NA (по умолчанию 300). В последнем случае программа сообщает реально достигнутую максимальную ошибку аппроксимации EMAX. Кроме того, всегда печатается гистограмма значений H0, показывающая распределение источников по глубине.
4. Вычисление поля в узлах интерполяции сводится к расчету тренда и добавлению к нему суммарного поля всех источников, найденных в процессе аппроксимации.
Оба алгоритма интерполяции – как на основе аппроксимации исходного поля полем точечных источников, так и интерполяция с учетом анизотропии исходного поля с оценкой точности интерполяции – настраиваются на особенности каждого узла сети. Другими словами, эти алгоритмы являются интеллектуальными. Переход от формальных алгоритмов (типа свертки матрицы значений поля с матрицей коэффициентов) к интеллектуальным как раз и отличает по существу современное геолого-геофизическое программное обеспечение от программного обеспечения двадцатилетней давности. К числу интеллектуальных алгоритмов относится также самонастраивающаяся фильтрация [3, 9], применяемая для выделения слабых аномалий, форма которых приблизительно известна.
Заключение
В работе приводятся характеристики программного комплекса GIA, предназначается для решения широкого круга задач обработки и анализа геолого-геофизической информации. Данный комплекс включает в себя «оболочку» и функциональные программные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных. Оболочка построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированность и унифицированный графический интерфейс пользователя. Набор функциональных модулей может расширяться с одновременным включением в оболочку новых пунктов меню. Такая структура программного комплекса, а также ориентация на хранение исходных данных в реляционной базе данных позволяют оперативно конфигурировать GIA для решения конкретного круга задач.