Scientific journal
Advances in current natural sciences
ISSN 1681-7494
"Перечень" ВАК
ИФ РИНЦ = 0,775

IDENTIFICATION OF UNIQUE LAKES OF PROTECTED AREAS OF THE ISHIM PLAIN USING GEOINFORMATION SYSTEMS

Korneenkova N.Yu. 1 Rasulova A.M. 1
1 Institute of Limnology of the Russian Academy of Sciences – a separate division of the Saint Petersburg Federal Research Center of the Russian Academy of Sciences
At present, when the existing network of observations of natural objects, including water ones, is extremely sparse and does not correspond to the degree of modern environmental threats, the issue of identifying water bodies with special characteristics in protected areas, the main task of which is to preserve natural complexes in all their diversity. On the example of reservoirs of specially protected natural territories (protected areas) the possibility of using machine learning methods to identify abnormal values of morphometric characteristics of lake basins is demonstrated in the Tobolo-Ishim interfluve. Morphometric parameters of lake basins were obtained by decoding water surfaces from Sentinel-2 satellite images. One Class Support Vector Machine (OC-SVM), based on the classification of objects in a multidimensional feature space, was chosen among the machine learning methods for identifying anomalies. Identification of anomalous objects occurs by constructing in the space of signs of a hyperplane separating the objects. The hyperplane is constructed in such a way that all normal data is on one side of it. An anomalous object is a point in n-dimensional space that does not pass through a hyperplane. The application of the algorithm of the single-class method of reference vectors to the selection of morphometric parameters of lakes located within the protected areas of the south of Western Siberia showed that the selected group of water bodies is fairly homogeneous. 10 objects recognized as anomalies were identified in it, however, according to their morphometric characteristics, they do not deviate much from the statistical average estimates of the entire sample. However, abnormal lakes require special attention due to the interdependence of morphometric parameters and hydrological processes occurring in the aquatic ecosystem.
unique lakes
Ishim Plain
anomaly search
outliers
machine learning methods
one-class support vector machine

Особенности климатических и почвенных условий, а также географического положения обуславливают интенсивное сельскохозяйственное освоение лесостепной зоны юга Западной Сибири.

Большая часть Ишимской равнины относится к бессточным районам, в пределах которых поверхностные воды характеризуются низким потенциалом самоочищения. Установлено, что в районах интенсивного животноводства техногенная миграция веществ сопровождается изменением химического состава и общей минерализации природных вод [1–3]. При этом существующая сеть наблюдений за природными объектами, в том числе водными, крайне разрежена и не отвечает степени современных экологических угроз.

При значительном ухудшении экологического состояния озер на фоне активной антропогенной деятельности требуется принятие специальных консервативных мер для охраны наиболее ценных объектов природы. Выделение водоемов с особыми характеристиками как никогда актуально на заповедных территориях, основная задача которых состоит в сохранении природных комплексов во всем их многообразии.

Задача настоящего исследования – на примере водоемов особо охраняемых природных территорий (ООПТ) Тоболо-Ишимского междуречья продемонстрировать возможности использования ГИС (с целью определения морфометрических характеристик неизученных водоемов) и кластерных моделей идентификации аномальных значений с дальнейшей экспертной оценкой их уникальных характеристик.

Район исследования расположен в средней части Тоболо-Ишимского междуречья в пределах плоской Ишимской равнины, слабо наклонной в северном направлении, со средними высотами 100 м.

Ишимская равнина сложена лессовидными суглинками различного механического состава, глинами, аллювиальными супесями и песками, которые развиты на континентальных отложениях неогенового возраста. В южной части равнины, соответствующей региону исследования, преобладает денудационный рельеф. Гидрографическая сеть представлена озерами и болотами, речная сеть выражена слабо, преимущественно на севере равнины.

Для поверхности равнины характерны суффозионные котловины, вытянутые пологие гряды с широкими плоскими вершинами и пологими склонами. Широко распространены межгривные ложбины, а также фрагменты днищ древних русел и речных долин, в которых размещаются крупные – площадью несколько десятков квадратных километров (Сиверга, Медвежье и др.), а также средние по площади озера, нередко соленые или горько-соленые.

Тоболо-Ишимское междуречье относится к регионам водного дефицита, тем не менее характерной чертой гидрографической сети рассматриваемой территории является значительная озерность. Помимо крупных и средних по величине остаточных водоемов, распространены также многочисленные бессточные озера, занимающие микрозападины площадью, как правило, менее 1 км2, которые приурочены к древним поверхностям выравнивания, развитым на дочетвертичных отложениях и перекрытых маломощным лессовидным покровом – пылеватыми известковистыми суглинками и супесями лессовидного облика [4]. Берега таких озер в основном слабо изрезанные, низменные, зачастую заболоченные. Значительная часть пресных мелководных озер подвержена зарастанию высшей водной растительностью. Наличие большого числа водных объектов, расположенных в пределах генетически однородной территории – поверхности выравнивания дочетвертичного возраста, дает хорошую перспективу для исследования морфометрических характеристик озер математическими методами идентификации аномалий.

Материалы и методы исследования

В настоящем исследовании рассмотрено 161 озеро в границах Частоозерского государственного природного зоологического заказника, а также в пределах западной части водно-болотных угодий «Озера Тоболо-Ишимской лесостепи», объединяющих несколько заказников.

Оценка количества водоемов и площадей их водной поверхности базировалась на автоматизированном дешифрировании данных Sentinel-2 с использованием многоканального спектрального индекса AWEI (Automated Water Extraction Index) [5]. Обработка данных Sentinel-2 и извлечение площадных характеристик водных объектов осуществлялись в программной среде QGIS.

Для получения морфометрических параметров озер проанализирован снимок Sentinel-2 с пространственным разрешением 10 м за 11 октября 2017 г., полученный посредством сервиса Earth-Еxplorer.

В ходе автоматизированной обработки спутникового изображения производилась векторизация растровых данных. Методом визуального дешифрирования выполнялось исправление поврежденной или неправильной геометрии полигонов, удаление островов высшей водной растительности и уточнение площадей, после чего производилось вычисление морфометрических характеристик озер. Из итоговых расчетов были исключены водоемы менее 0,005 км2 в связи с погрешностями определения их площадных и линейных характеристик.

Таблица 1

Статистические оценки морфометрических характеристик 161 озера Ишимской равнины

Параметр

Мин.

Макс.

Среднее

Стандартное отклонение

Дисперсия

Асимметрия

Эксцесс

S

0,02

1,78

0,44

0,33

0,11

1,38

2,12

L

0,2

2,67

0,81

0,37

0,13

1,58

4,55

Wmax

0,16

1,33

0,64

0,24

0,06

0,40

-0,23

Wavg

0,12

1,01

0,48

0,18

0,03

0,34

-0,18

P

0,72

8,84

3,11

1,39

1,93

1,09

1,63

ks

0,22

0,84

0,62

0,11

0,01

-1,03

1,47

1/ks

1,19

4,46

1,69

0,46

0,21

3,29

14,19

S*

6,42·10-8

4,62·10-6

1,15·10-6

8,62·10-7

7,42·10-13

1,38

2,12

K

0,6

0,31

0,36

0,04

1,90·10-3

2,58

9,17

Районирование в целях выделения статистических совокупностей озер с учетом рельефа территории проводилось на основе данных геоморфологической схемы масштаба 1:2 500 000 [6].

В рамках работ были получены площадные (S, км2) и линейные характеристики 161 водоема в пределах ООПТ Тоболо-Ишимского междуречья. Линейные характеристики включали: длину (L, км), среднюю (Wavg, км) и максимальную (Wmax, км) ширину и периметр (P, км). Дополнительно рассчитывались: коэффициент сжатия зеркала озера (ks = Wavg / L), показатель удлиненности (1/ks), безразмерная площадь озера S* = S / SKS, (относительно площади Каспийского моря), а также коэффициент изрезанности береговой линии missing image file.

Из числа озер, по которым были получены площадные и линейные характеристики, 150 озер не превышают по площади 1 км2.

Статистические оценки морфометрических параметров изучаемых озер Тоболо-Ишимского междуречья приведены в табл. 1. Оценки показывают, что распределение большинства параметров близко к гауссовому, а для Wavg является таковым. Несмотря на то, что распределение морфометрических параметров легко приводится стандартными преобразованиями к нормальному виду и можно применить статистические критерии идентификации выбросов, как это было сделано в [7], в данном исследовании для того, чтобы не трансформировать исходную выборку, воспользуемся нестатистическим методом поиска аномалий, не требующим нормального распределения.

Для анализа выборки использовался одноклассовый метод опорных векторов (One Class Support Vector Machine (OC-SVM)). Реализация алгоритма OC-SVM осуществлялась с помощью библиотеки Phyton Scikit-learn. Группа методов опорных векторов (Support Vector Machine, SVM) основывается на классификации данных [8, 9]. В этой группе методов выделение отдельных классов происходит с помощью разделения n-мерного пространства признаков объектов гиперплоскостью, которая располагается так, чтобы расстояние между классами было максимальным.

Пусть missing image file, – входные данные, представляющие собой векторы размерности n, а X ∈ Rn, где Rn – пространство признаков. Каждый xi – вектор данных, а yi – отвечает за класс, к которому принадлежит xi. Основной задачей всех алгоритмов, основывающихся на методе опорных векторов, является нахождение функции f(x), такой что отклонение от yi меньше ε и f(x) – максимально плоская. В простейшем случае f(x) может иметь линейный вид [10], т.е.

missing image file, (1)

где missing image file – скалярное произведение в X, w – вектор нормали к гиперплоскости, параметр b отвечает за смещение гиперплоскости относительно начала координат. Поскольку было принято допущение, что гиперплоскость описывается линейным уравнением (1), то для этого норма missing image file должна быть минимальна. Тогда задачу поиска такой f(x), которая аппроксимирует все missing image file с точностью до ε можно сформулировать как

missing image file, при missing image file. (2)

То есть решается задача выпуклой оптимизации.

Особенностью алгоритма одноклассового метода опорных векторов является применение так называемой функции ядра, которая преобразует исходное пространство признаков размерности n в пространство размерности m, причем m > n. Гиперплоскость, отделяющая нормальные данные от аномальных, строится в пространстве Rm.

При поиске аномалий морфометрических параметров озер Тоболо-Ишимского междуречья использовалось гауссово ядро с радиальной базисной функцией, имеющее вид [11]:

missing image file, (3)

где γ – параметр ядра, который в данной работе выбран пропорционально матрице данных.

Как и в простейшем случае с линейной функцией (1) для группы методов опорных векторов, решается задача выпуклой оптимизации, аналогичная (2), которую можно сформулировать следующим образом:

missing image file (4)

где ξi – дополнительные переменные, характеризующие значения ошибки для точек в X, η – параметр регуляризации, который отвечает за верхнюю границу доли выбросов, ρ – параметр, характеризующий максимальное расстояние гиперплоскости от начала координат. В этом случае функция решения f(x) приобретает более сложный вид, в отличие от линейной функции (1), через кусочно-постоянную функцию sgn(x) и функцию ядра, отвечающую за форму гиперплоскости:

missing image file, (5)

где αi – множители Лагранжа.

В алгоритме OC-SVM аномальным объектом считается точка в n-мерном пространстве, которая не проходит за гиперплоскость.

Результаты исследования и их обсуждение

Применение алгоритма одноклассового метода опорных векторов к выборке морфометрических параметров озер, расположенных в пределах ООПТ юга Западной Сибири, позволило идентифицировать 10 объектов, которые были признаны аномалиями (рисунок, табл. 2).

Многие из вошедших в итоговый набор водоемов ранее практически не изучались и могут рассматриваться как потенциальные объекты при проведении полевых исследований.

Перечень озер с аномальными характеристиками включает озера с площадями зеркала от 0,02 до 1,78 км2. Рассчитанная площадь семи водоемов более 0,5 км2, четырех – более 1 км2. Наиболее крупные озера – Большое (№ 7), Большое Бердюжье (№ 3), Богородское (№ 5), Чебачье (№ 6).

Таблица 2

Перечень выяленных озер с аномальными параметрами

№ п/п*

Координаты

L

Wav

Wmax

Р

S

ks

1/ks

K

X

Y

               

1

68,0466

55,9280

1,5

0,91

1,25

6,96

1,37

0,61

1,64

0,36

2

68,0937

55,9216

0,87

0,2

0,3

2,36

0,17

0,22

4,46

0,6

3

68,3029

55,7981

1,61

1,01

1,3

6,2

1,62

0,63

1,59

0,36

4

68,0692

55,7328

1,4

0,46

0,77

4,52

0,64

0,32

3,08

0,49

5

68,4325

55,6302

2,08

0,54

0,96

6,92

1,12

0,25

3,87

0,55

6

68,9289

55,6128

1,07

0,9

0,98

4,84

0,96

0,84

1,19

0,31

7

68,9017

55,4765

2,67

0,67

1,05

8,84

1,78

0,25

4

0,56

8

68,8229

55,9003

0,98

0,74

0,93

3,92

0,73

0,76

1,32

0,32

9

68,7944

55,8980

0,31

0,25

0,31

1,28

0,08

0,8

1,24

0,31

10

68,3442

55,6860

0,2

0,12

0,16

0,72

0,02

0,62

1,61

0,36

missing image file

Озера с аномальными характеристиками, выявленные в пределах ООПТ Тоболо-Ишимского междуречья Условные обозначения: 1 – исследованные озера; 2 – озера с аномальными характеристиками; 3 – границы ООПТ: I – государственный природный заказник федерального значения «Белоозерский» (водно-болотные угодья международного значения), II – Частоозерский государственный природный зоологический заказник, III – «Уктузский» (перспективный), IV – государственный природный заказник регионального значения «Южный» (водно-болотные угодья международного значения), V – водно-болотные угодья международного значения «Тоболо-Ишимская лесостепь»

Коэффициент сжатия ks у шести водоемов превышает 0,6, в том числе у двух озер ks более 0,8 (№ 6 и 9). Для четырех водоемов выявленный ks находится в диапазоне от 0,2 до 0,3. Коэффициент изрезанности береговой линии К изменяется от 0,31 до 0,59. Наибольшие значения К, превышающие 0,5, рассчитаны для трех озер c минимальным в группе коэффициентом сжатия ks.

Наибольший показатель удлиненности 1/ks получен для озера № 2 (4,46). Наименьшие значения 1/ks и К отмечены для озера Чебачье (№ 6 в табл. 2).

Анализ показателя удлиненности 1/ks показывает, что у шести выявленных озер с аномальными характеристиками форма котловины округлая или близка к округлой, у четырех водоемов близкая к овальной.

Заключение

Исследование морфометрических характеристик озер Тоболо-Ишимского междуречья показало, что выбранная группа водных объектов является достаточно морфометрически однородной. Водоемы с аномальными морфометрическими характеристиками не отклоняются сильно от статистических средних оценок выбранной группы озер. По происхождению озера суффозионные, преимущественно округлой формы, ряд выявленных водоемов отмечается изменением морфометрия в связи с зарастанием высшей водной растительностью (№ 2, 4, 5). Тем не менее идентификация данных водных экосистем одноклассовым методом опорных векторов, как аномальных, указывает на особенности совокупности их морфометрических параметров по сравнению со всей выборкой. Как было показано авторами [7], аномалии по морфометрическим параметрам, в силу взаимообусловленности происходящих в озерах процессов, могут быть связаны с уникальными значениями гидрохимических, гидрологических и гидробиологических характеристик водной экосистемы. Вместе с тем говорить об их исключительности в настоящем случае не приходится, как это было сделано в предыдущих исследованиях на глобальных выборках озер [7], в силу недостаточной изученности данных водоемов. Тем не менее выделенные озера, несмотря на достаточно скромные размеры, следует учитывать при изучении возможностей выявления аномальных характеристик водной среды в данном регионе.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта 20-05-00303\22 «Выявление критериев уникальности озерных экосистем».